2月16日,馬斯克在社交平臺(tái)X上宣布,Grok 3大模型將于太平洋時(shí)間周一晚上8點(diǎn)(北京時(shí)間2月18日12點(diǎn))正式發(fā)布,并且會(huì)同步進(jìn)行現(xiàn)場(chǎng)演示。馬斯克對(duì)Grok 3的贊譽(yù)毫不吝嗇,稱其為 “地球上最聰明的人工智能”,其推理能力將超越包括ChatGPT和DeepSeek在內(nèi)的其他領(lǐng)先AI模型。據(jù)悉,為了確Grok 3在發(fā)布時(shí)能夠呈現(xiàn)出最佳狀態(tài),馬斯克透露,整個(gè)周末他都將與團(tuán)隊(duì)成員并肩作戰(zhàn),全身心投入到產(chǎn)品的打磨工作中。
Grok大模型是馬斯克旗下的xAI公司推出的新一代人工智能模型,2023年11月,xAI發(fā)布第一款大模型Grok-1,邁出了在大模型領(lǐng)域探索的第一步。2024年3月18日,xAI團(tuán)隊(duì)又推出了參數(shù)量高達(dá)3140億的Grok-1模型,這一參數(shù)量遠(yuǎn)超OpenAI GPT-3.5的1750億,成為當(dāng)時(shí)參數(shù)量最大的開源大語言模型。
2024年8月,Grok 2大模型發(fā)布 。Grok 2主要應(yīng)用于訓(xùn)練AI聊天機(jī)器人。與Grok 1相比,它在訓(xùn)練數(shù)據(jù)的使用上有所改進(jìn)。Grok 1在訓(xùn)練時(shí)未完全依賴真實(shí)世界數(shù)據(jù),采用了大量合成數(shù)據(jù),導(dǎo)致在處理真實(shí)世界中的細(xì)微差別和復(fù)雜性時(shí)表現(xiàn)欠佳。而Grok 2雖然依舊使用了大規(guī)模合成數(shù)據(jù)集,但同時(shí)融入了少量高質(zhì)量的真實(shí)世界數(shù)據(jù),在一定程度上彌補(bǔ)了初代模型在處理真實(shí)場(chǎng)景方面的不足。
而此次即將發(fā)布的Grok 3,其最大的特點(diǎn)在于引入了“思維鏈”(Chain Of Thought)推理能力。該能力讓Grok 3能夠像人類認(rèn)知過程一樣逐步處理復(fù)雜任務(wù),顯著提高了模型處理復(fù)雜查詢和提供更連貫、更有邏輯的響應(yīng)的能力。Grok 3模型在推理、編程能力以及文本和圖像分析等多模態(tài)功能方面有了顯著的提升。
去年夏天,馬斯克便在社交平臺(tái)X上高調(diào)宣布,Grok-3將依托10萬張英偉達(dá)H100 GPU的超強(qiáng)算力進(jìn)行訓(xùn)練,彼時(shí)計(jì)劃在2024年底推出,并稱贊其 “將會(huì)是非常特別的”。但現(xiàn)實(shí)卻事與愿違,Grok-3的發(fā)布進(jìn)程受阻。業(yè)內(nèi)分析,xAI團(tuán)隊(duì)規(guī)模相對(duì)較小,在人力、資源調(diào)配等方面可能面臨諸多挑戰(zhàn),這在一定程度上拖慢了項(xiàng)目的推進(jìn)速度。
在人工智能大模型領(lǐng)域,競(jìng)爭(zhēng)態(tài)勢(shì)瞬息萬變,每一次新品發(fā)布都可能重塑市場(chǎng)格局。在Grok 3推遲發(fā)布期間DeepSeek異軍突起,迅速搶占市場(chǎng)份額,成為AI領(lǐng)域的一匹黑馬。 此次Grok-3姍姍來遲,如今市場(chǎng)格局已發(fā)生變化,Grok-3能否在競(jìng)爭(zhēng)激烈的市場(chǎng)中分得一杯羹還未可知。