Tech星球(微信ID:tech618)文|任雪蕓
封面來源|圖蟲創(chuàng)意
比預(yù)想中更快一步,3月16日,百度正式發(fā)布文心大模型4.5(以下簡稱文心4.5)及文心大模型X1(以下簡稱文心X1),在文心一言官網(wǎng)即可免費(fèi)使用。文心4.5不僅在基礎(chǔ)能力上有大幅度提升,且具備原生多模態(tài)等能力,其多項(xiàng)基準(zhǔn)測試成績優(yōu)于GPT4.5、DeepSeek-V3等,并且平均分達(dá)到79.6分,高于GPT4.5的79.14。文心X1不僅在性能上對標(biāo)DeepSeek-R1,且具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個自主運(yùn)動工具的深度思考模型。和DeepSeek橫空出世一樣,文心4.5和文心X1不僅點(diǎn)燃了國內(nèi)用戶的熱情,更讓外網(wǎng)沸騰。在推特上,不少人紛紛在求百度測試賬號,他們?yōu)閮纱竽P蛢?yōu)異的性能和超低的價格感到不可思議,不少人覺得百度的股價被低估了。甚至有人在百度推特賬號下@薩姆奧爾特曼,他們表示游戲結(jié)束了。
在看到文心新模型的表現(xiàn)后,在推特上擁有70萬粉絲的美國投資人Bill Gurley感慨道,美國人工智能公司應(yīng)將100%的時間用于開發(fā)和創(chuàng)新,而不是在華盛頓特區(qū)游說尋求保護(hù)以躲避競爭。這種情況很糟糕,明顯暴露出缺乏自信。
兩大模型的優(yōu)異能力,是對過去3月外界對于“百度大模型掉隊(duì)了”最有效的回應(yīng),也再一次證明了百度對AI戰(zhàn)略貫徹到底的決心。畢竟,大模型競技是一場持久戰(zhàn),拼的是耐力、技術(shù)、資本。從Transformer到OpenAI-o1和DeepSeek-R1,技術(shù)的更新時刻在發(fā)生,沒有人可以保證永遠(yuǎn)領(lǐng)先,但關(guān)鍵的是敢拼的勇氣。所有玩家從來沒有放棄和停止在大模型領(lǐng)域的努力,百度也是如此。開年以來,百度在大模型領(lǐng)域動作頻頻文心一言完全免費(fèi)、文心4.5將于6月30日正式開源;百度核心業(yè)務(wù)搜索接入DeepSeek;很快百度還會發(fā)布4.5系列模型,以及更前沿的下一代模型5.0版本。動作頻頻的背后,透露出百度依然想留在牌桌上的決心,它也確實(shí)做到了。但百度并不能掉以輕心。因?yàn),大模型的終局遠(yuǎn)未到來,包括百度在內(nèi),所有的玩家都必須全力以赴。這也是百度堅(jiān)持不懈的根源。
百度加速變革:一場必要的戰(zhàn)略糾偏
半個月之前,OpenAI舉辦了一場線上發(fā)布會,正式發(fā)布了其最新一代基礎(chǔ)模型GPT-4.5。3月16日,百度并沒有任何發(fā)布動作,而是直接上線了文心4.5與文心X1。
這場上線發(fā)生得悄無聲息。有百度內(nèi)部人士稱,無論是文心4.5全面免費(fèi),還是PC和移動兩端直接上線,百度管理層都是在半天之內(nèi)做出的決策。
這似乎是現(xiàn)在的百度與過去的百度,以及行業(yè)的一場賽跑。
這一次的百度越來越快了。據(jù)百度方面透露,此次文心4.5和X1大模型發(fā)布之后,百度后續(xù)還會推出文心4.5系列模型,以及在下半年推出更先進(jìn)的下一代模型5.0版本。
其實(shí),此次模型迭代進(jìn)程明顯加快,并非偶然。這一現(xiàn)象背后,其實(shí)是百度對過往策略選擇的反思與積極糾偏。
過去半年間,DeepSeek等新興公司憑借開源、低成本的模式,給OpenAI、百度這類傳統(tǒng)大模型巨頭帶來了不小的壓力。如今,全球AI企業(yè)中,無論是OpenAI,還是百度,都逐漸意識到,大模型領(lǐng)域未來走向依舊充滿變數(shù),尚無定論。
激烈競爭的大模型領(lǐng)域,保持競爭力的關(guān)鍵在于果敢地 “求變”。于是,就在今年2月,比OpenAI更快一步,百度決定及時轉(zhuǎn)變策略。
隨后,百度創(chuàng)始人李彥宏就快速且堅(jiān)決地推動了一系列動作:文心一言免費(fèi)、核心業(yè)務(wù)搜索接入DeepSeek、文心大模型4.5系列將在6月30日正式開源等。
這次糾偏是文心一言對當(dāng)下市場競爭的直接回應(yīng)。從悄然上線文心4.5與X1,以及后續(xù)透露的一系列迭代計(jì)劃,無一不彰顯出百度謀求變革的堅(jiān)定決心。
不過,百度突然加快腳步,讓外界有人質(zhì)疑它可能會迷失方向。但目前來看,百度的“變快”建立在對自身技術(shù)實(shí)力與市場趨勢的研判上,每一次模型的迭代都伴隨著技術(shù)架構(gòu)的深度優(yōu)化,以及性能的飛躍提升。
從百度自有業(yè)務(wù)來看,百度旗下多款用大模型重構(gòu)后的AI應(yīng)用,包括百度App、百度地圖、百度網(wǎng)盤、百度文庫等體驗(yàn)感都在持續(xù)提升。在此次文心4.5與文心X1上線后,這些應(yīng)用也在迎來全方位升級。
讓大模型產(chǎn)品,植入“原生技術(shù)內(nèi)核”
作為百度重回牌桌的階段性產(chǎn)品,原生多模態(tài)大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面實(shí)現(xiàn)了蛻變與升級?據(jù)了解,文心4.5是百度自主研發(fā)的新一代原生多模態(tài)大模型,通過多個模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。而文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個自主運(yùn)用工具的深度思考模型,兼?zhèn)錅?zhǔn)確、創(chuàng)意和文采。基于文心大模型4.5和文心大模型X1,Tech星球分別實(shí)測了一些應(yīng)用場景。我們上傳了一段“體重管理年”的新聞視頻,要求文心4.5概括新聞內(nèi)容,可以看到其給出了準(zhǔn)確的回答,證明了其跨模態(tài)的能力。目前,文心4.5支持上傳的視頻文件,兼容常見的格式,單個視頻文件大小不超過20M。
在圖片理解上,通過這個問題也能夠看出在圖形推理、圖表分析的“高智商”以外,文心4.5還具備了理解梗圖、漫畫、歌曲、電影等多模態(tài)內(nèi)容的“高情商”。
此外,文心4.5的能力也在圖片生成、RAG(Retrieval Augmented Generation檢索生成增強(qiáng))測試、邏輯測試、文本創(chuàng)作等方面得到了很好地體現(xiàn)。在文心X1的測試中能夠看到,作為一個能力更全面的深度思考模型,其在邏輯問題中展現(xiàn)了周密的思考過程,且在答案的輸出上更為明確、直接。
在文本創(chuàng)作類的問題中,也能夠看出文心X1擅長寫“銳評”,避免“端水”,回答尖銳有態(tài)度。
Tech星球獲悉,文心X1在技術(shù)層面頗具創(chuàng)新,主要運(yùn)用遞進(jìn)式強(qiáng)化學(xué)習(xí)訓(xùn)練方法,以思維鏈和行動鏈為依托開展端到端訓(xùn)練,還構(gòu)建起統(tǒng)一的獎勵系統(tǒng),融入多元獎勵機(jī)制。憑借這些技術(shù),文心X1能夠在諸多場景中大顯身手,包括中文知識問答、文學(xué)創(chuàng)作、文稿寫作、日常對話、邏輯推理、復(fù)雜計(jì)算等。此外,多工具調(diào)用是文心X1的特色之一。目前,X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢、詞云生成等多款工具。
技術(shù)+場景,大模型的生態(tài)戰(zhàn)