新智元報道
編輯:KingHZ【新智元導(dǎo)讀】新年伊始,AI專家Gary Marcus發(fā)布長文,公布了他對2025年AI發(fā)展最新的25項預(yù)測,包括AGI、生成式AI、自動駕駛、人形機器人、視頻生成、智能體等多個方向。雖然在2024年對OpenAI估值預(yù)測出錯,但在最新的預(yù)測中仍不看好OpenAI。去年,馬庫斯對于AI趨勢的預(yù)測幾乎全部正確,但完全沒想到OpenAI可以估值到1500億美元。
在本月2日,馬庫斯發(fā)表了對2025年的25個AI預(yù)測,涵蓋AGI、GenAI、自動駕駛、人形機器人、智能體等多個方向。
馬斯克(Elon Musk),曾預(yù)測2025年底的AI能力:「我們就會擁有比任何人都聰明的AI」。
馬庫斯對此并不認(rèn)同,主要預(yù)測內(nèi)容如下:
1. 反對馬斯克的預(yù)言,到2025年底不會出現(xiàn)強人工智能。
2. GenAI的可靠性、推理、幻覺、能耗等問題得不到根本的解決。
3. 智能體和類人機器人在2025年會得到大量宣傳,但應(yīng)用有限。
4.AI模型盈利難,估值開始下滑;OpenAI市場表現(xiàn)不佳;自動駕駛難落地。
對2025年的25項預(yù)測
高置信度預(yù)測1 通用人工智能(AGI)不會在2025年實現(xiàn)。(可能會有人通過弱化定義甚至用經(jīng)濟標(biāo)準(zhǔn)重新定義AGI來試圖混淆概念。)
2 到2025年底,沒有任何單一系統(tǒng)能可靠解決四項以上的Marcus-Brundage的AI 2027任務(wù),甚至可能沒有任何任務(wù)被完全解決。
3 AI模型的盈利將繼續(xù)保持在中等偏下水平甚至可能不復(fù)存在(芯片制造公司如NVIDIA在供應(yīng)硬件方面會繼續(xù)表現(xiàn)優(yōu)異,但模型開發(fā)公司在這場「淘金熱」中只能充當(dāng)「賣鏟子」的角色)。
4 美國幾乎不會有實質(zhì)性法規(guī)出臺,消費者仍面臨GenAI帶來的風(fēng)險。全球其他地區(qū)在法規(guī)制定上會越來越參考?xì)W洲的做法。
5 國家AI安全研究所將提供指導(dǎo),但它們對危險模型的約束力將非常有限。
6 GenAI的可靠性問題將在2025年持續(xù)存在。
7「幻覺」現(xiàn)象(即生成內(nèi)容中的虛構(gòu)敘述)問題將繼續(xù)困擾GenAI。
8 推理能力的不足仍將繼續(xù)困擾GenAI。
9 AI「智能體」將在2025年被廣泛宣傳,但在除了一些非常狹窄的應(yīng)用場景外,仍然難以實現(xiàn)可靠性。
10 類人機器人將受到大量宣傳,但不會有產(chǎn)品能夠接近The Jetsons中「Rosie機器人」的能力。盡管運動控制可能表現(xiàn)優(yōu)異,但場景意識和認(rèn)知靈活性仍然不足。
The Jetsons中的機器人Rosie
11 OpenAI將繼續(xù)提前數(shù)月甚至數(shù)年預(yù)覽產(chǎn)品,但正式推出和廣泛可用仍需較長時間。(例如,Sora于2024年2月預(yù)覽,直到12月才正式發(fā)布,且受到使用限制;Sal Khan在2024年5月演示的AI家庭教師仍未普及;o3 已進行了預(yù)覽,但尚未發(fā)布,其價格可能相當(dāng)昂貴。)
12 與2016年Hinton的預(yù)測相反,很少有放射科醫(yī)生會被AI替代。
13 真正的無人駕駛汽車(無需人類參與交通)仍將限制在少數(shù)城市,且在天氣良好的條件下。人類駕駛員仍將在經(jīng)濟中占很大比重。
14 GenAI的版權(quán)相關(guān)訴訟將在2025年持續(xù)不斷。
15 AI模型的能耗將上升并會成為一個主要問題,但很少有GenAI公司會公開用電量。
16 被AI替代的勞動力比例將少于10%,可能少于5%。商業(yè)藝術(shù)家和配音演員可能受到最大的影響。(當(dāng)然,隨著人們開始使用新工具,許多工作也會隨之改變。)
17 馬庫斯依然堅持關(guān)于o3的預(yù)測,即一開始人們會感到驚奇,然而一旦深入探究就會發(fā)現(xiàn)o3不可靠;o3在封閉領(lǐng)域(比如數(shù)學(xué))表現(xiàn)最佳,而在開放領(lǐng)域(比如關(guān)于真實世界的日常推理)表現(xiàn)欠佳。
中等置信度預(yù)測
18 技術(shù)「護城河」仍然難以建立。相反,中美兩國將趨同到大體相似的AI模型;歐洲的部分系統(tǒng)也將趕上大致相同的位置。
19 由于價格及其穩(wěn)定性與價格不匹配的原因,很少有公司(更不要提更少的消費者)會大規(guī)模采用o3。
20 公司將繼續(xù)嘗試使用AI,但將其全面采用為生產(chǎn)級系統(tǒng)并在現(xiàn)實世界中大規(guī)模部署的態(tài)度仍然會非常謹(jǐn)慎。
21 2025年可能成為AI大公司估值開始下滑的一年。(盡管正如那句名言所說,「市場的非理性比你的償付能力持續(xù)得更久!梗
22 Sora在物理學(xué)領(lǐng)域?qū)⒗^續(xù)表現(xiàn)不佳。(谷歌的Veo 2看起來似乎有所改進,但由于尚未親自測試,仍然懷疑其在狀態(tài)變化和對象持久性上的問題。另一種尚未完全發(fā)布的基于不同原理的混合系統(tǒng),稱為Genesis,看起來可能很有前景。)
23 神經(jīng)符號AI的影響力將在2025年顯著增加。
低置信度預(yù)測,但值得討論
24 我們很可能會看到GenAI在大規(guī)模網(wǎng)絡(luò)攻擊中扮演重要的重要角色。馬庫斯將在Politico中發(fā)表一篇短文,討論可能的4種方式。
25 到2025年底,可能仍然不會出現(xiàn)「GPT-5級別」的模型(即通過社區(qū)共識認(rèn)為在各方面實現(xiàn)重大飛躍的模型)。相反,我們可能會看到像o1這樣的模型,它在許多可生成高質(zhì)量合成數(shù)據(jù)的任務(wù)中表現(xiàn)良好,但在其他領(lǐng)域僅比GPT-4有小幅改進。
2024年的預(yù)測回顧
總的來說,馬庫斯對2024年預(yù)測盡管存在一些需要注意的地方,但大體上得到了驗證。核心預(yù)測在2024年3月, 馬庫斯發(fā)帖總結(jié)了對2024年的最核心的預(yù)測。
唯一的例外可能是OpenAI的o3,它在去年12月宣布,但至今未發(fā)布,也未接受廣泛的審查。
除此之外,所有七條預(yù)測基本上都非常接近預(yù)期。
2024年的現(xiàn)實情況:
我們目前仍然處于GPT-4級別階段,這些模型只是做了些許漸進性的改動,沒有一個值得OpenAI冠以GPT-5之名。
如今有許多類似的模型,市場上充斥著價格戰(zhàn),幾乎沒有護城河。
幻覺問題依然沒有得到有效解決。
企業(yè)級的采用遠(yuǎn)不如大多數(shù)人原本預(yù)期的那樣廣泛,所有公司的總體利潤(當(dāng)然,硬件公司如英偉達除外,它們通過銷售芯片而非AI模型獲利)也充其量只是中等偏下水平的增長。
到目前為止,參與的許多公司都在虧損,雖然至少有三家公司被半收購,而它們?yōu)橥顿Y者帶來的利潤極為有限。
2024年最重大的AI事件并不是大家期待已久的GPT-5發(fā)布,盡管粉絲們整年都在預(yù)測它的到來,但它始終未曾出現(xiàn)。
2024年的其他預(yù)測馬庫斯從2022年開始,就預(yù)言單純依靠擴展大語言模型 (LLM) 的方法最終會走到盡頭,在2024年11月和12月業(yè)內(nèi)人士的評論似乎驗證了這一預(yù)測。
馬庫斯在2022年提出的「scaling law」并非物理定律,而是具有有限生命周期的泛化規(guī)則的觀點,在最近幾個月得到了廣泛傳播。
馬庫斯提出的「AI碰壁」(hitting a wall)這一概念在CNN、《The Verge》和《華爾街日報》等媒體中也得到廣泛報道。
馬庫斯關(guān)于「擴展scaling與收益遞減」的觀點和相關(guān)術(shù)語已逐漸普及。
馬庫斯在2022年,以及早在2001年出版的《The algebraic mind》一書中提出的具體弱點(如組合性、事實性和推理能力等)依然存在。盡管這些問題或許會在未來得到解決,但當(dāng)前的技術(shù)手段顯然不夠。
馬庫斯在1998年、1999年和2001年,以及之后多次強調(diào)的分布漂移(distribution shift)問題,在最近的研究中得到了多次印證,例如蘋果公司的關(guān)于推理的著名論文。
論文鏈接:https://arxiv.org/pdf/2410.05229
在2022年12月,馬庫斯預(yù)測的聊天機器人導(dǎo)致死亡的事件。
在2023年,該預(yù)言不幸得到了證實,而2024年似乎又出現(xiàn)了類似案例。
關(guān)于AI生成錯誤信息,馬庫斯的警告正在逐步成為現(xiàn)實,盡管到目前為止,其影響比最初擔(dān)憂的要輕。但馬庫斯仍然感到擔(dān)憂,并認(rèn)為需要保持警惕。
在2023年2月,馬庫斯提出的關(guān)于GenAI破壞互聯(lián)網(wǎng)的警告,越來越顯得正確。
馬庫斯在2022年11月預(yù)測,LLM不會立即顯著改善如亞馬遜Alexa等商業(yè)AI智能體,這一預(yù)測在2024年仍然成立。
馬庫斯預(yù)測2024年會被視為「AI 幻滅之年」。這一說法可能有些夸大,但對部分人來說卻是事實。雖然許多人仍然對AI情不減,但也有不少人大失所望。例如,《華爾街日報》報道:「微軟AI機器人的早期采用者懷疑其是否物有所值」。
馬庫斯在2023年關(guān)于OpenAI可能被視為AI界WeWork的預(yù)測尚未得到驗證,但OpenAI的處境仍不樂觀。
OpenAI尚未盈利,預(yù)計至少到2029年之前都不會盈利,其消耗資金的速度以十億美元計,且仍缺乏明確的技術(shù)護城河。從長期來看,特別是在高估值情況下,安全性仍然不確定。記者Ed Zitron和經(jīng)濟學(xué)家Brad DeLong等人也越來越多地表達了類似觀點。
關(guān)于生成式AI技術(shù)和經(jīng)濟限制的預(yù)測大體正確,但馬庫斯對投資者的判斷完全錯誤。馬庫斯原本認(rèn)為OpenAI不太可能獲得另一輪大規(guī)模融資,更不用說估值超1500億美元。但時間會證明這是否是一項明智的投資。
在2024年2月Sora公布后不久,馬庫斯指出其在物理領(lǐng)域的問題,并預(yù)測這些問題不會消失。這一預(yù)測目前仍然成立。
馬庫斯在2022年12月關(guān)于GPT-4的七項預(yù)測(見下圖)大部分已被證實(第七項仍待驗證),適用于2024年發(fā)布的所有模型。
參考資料:https://garymarcus.substack.com/p/25-ai-predictions-for-2025-from-marcus