展會信息港展會大全

月之暗面發(fā)布數(shù)學(xué)大模型,對標(biāo)OpenAI o1
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-20 21:27:13   瀏覽:44次  

導(dǎo)讀:圖片來源:視覺中國中國人工智能正在快速追趕OpenAI。11月16日下午,中國通用人工智能公司月之暗面宣布:發(fā)布數(shù)學(xué)大模型k0-math。這是該公司首次推出推理能力強化模型產(chǎn)品。按照該公司的說法,k0-math的數(shù)學(xué)能力可對標(biāo)全球領(lǐng)先的OpenAI o1系列可公開使用的兩個模型o1-mini和o1-preview。具體而言,在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測試MATH中,k0-math模型得分93.8分,超過o1-mini ......

月之暗面發(fā)布數(shù)學(xué)大模型,對標(biāo)OpenAI o1

圖片來源:視覺中國

中國人工智能正在快速追趕OpenAI。

11月16日下午,中國通用人工智能公司月之暗面宣布:發(fā)布數(shù)學(xué)大模型k0-math。這是該公司首次推出推理能力強化模型產(chǎn)品。

按照該公司的說法,k0-math的數(shù)學(xué)能力可對標(biāo)全球領(lǐng)先的OpenAI o1系列可公開使用的兩個模型o1-mini和o1-preview。

具體而言,在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測試MATH中,k0-math模型得分93.8分,超過o1-mini的90分和o1-preview的85.5分。k0-math這一成績僅次于o1完全版的94.8分。

需要注意的是,k0-math模型雖然擅長解答大部分有難度的數(shù)學(xué)問題,但是當(dāng)前版本還無法解答難以描述的幾何圖形類問題。

此外,這款產(chǎn)品還有一些局限性需要突破,包括對于過于簡單的數(shù)學(xué)問題,例如1+1=?這類問題時k0-math模型可能會“過度思考”,回答出一些偏離常識的答案。

月之暗面創(chuàng)始人楊植麟在回答《財富》的問題時表示:對于強化學(xué)習(xí)而言,“數(shù)據(jù)”是一個核心問題,如果未來能夠把大模型的獎勵機制做好,將會避免不必要的“過度思考”!拔覀儸F(xiàn)在沒有答案的長度做任何的限制,讓人工智能自由的思考,也許可以通過改變獎勵結(jié)構(gòu)的方式,抑制過度思考,這是我們接下來想去解決的問題!彼f。

月之暗面是中國估值最高的人工智能大模型公司之一。

Kimi智能助手則是月之暗面旗下的核心產(chǎn)品,目前它擁有3,600萬用戶。據(jù)阿里財報披露,阿里巴巴在2024財年投資8億美元,購入月之暗面36%股權(quán),可知彼時月之暗面估值約22億美元。今年5月,騰訊、高榕資本等新資方加入,這也推動了月之暗面估值超過30億美元。

31歲的楊植麟畢業(yè)于清華大學(xué),并獲得美國卡內(nèi)基梅隆大學(xué)計算機博士,他曾在Meta AI和Google AI研發(fā)團隊工作。

在過去一年,Kimi經(jīng)歷了高速增長。

由于Kimi支持200萬字的無損上下文輸入,在文本解析和長文本處理方面表現(xiàn)出色。這一優(yōu)勢使其在閱讀理解、文獻分析、長文寫作等任務(wù)上具有獨特優(yōu)勢。2024年4月,Kimi智能助手網(wǎng)頁版訪問量達到2,004萬,較上月上漲60.2%,訪問量超過百度的文心一言。

當(dāng)下,中國基礎(chǔ)大模型公司競爭激烈,包括騰訊、百度、阿里巴巴以及字節(jié)跳動在內(nèi)的各個公司都推出了大模型產(chǎn)品。

在競爭版圖中,字節(jié)跳動旗下產(chǎn)品“豆包”正在成為Kimi最可怕的競爭者。

11月初,在AI產(chǎn)品榜(aicpb.com)的全球總榜(App)上,豆包位列第二,僅次于ChatGPT。年初至今,豆包的累計下載量已經(jīng)突破1億。就中國而言排名前三的分別是豆包與百度旗下的文小言以及Kimi,月活躍用戶數(shù)均超千萬。

在回應(yīng)與豆包的競爭時,楊植麟表示,他并不太關(guān)注競爭本身!耙驗楦偁幈旧聿划a(chǎn)生價值!彼f,“只有推出更好的技術(shù)和產(chǎn)品,才能給用戶創(chuàng)造更大價值,這是我們現(xiàn)在最核心的問題!

楊植麟最為關(guān)注的數(shù)據(jù)是用戶留存率。他認為現(xiàn)在Kimi僅僅達到通用人工智能的初級階段,用戶留存率這一指標(biāo)與技術(shù)成熟度正相關(guān),隨著技術(shù)不斷提升,kimi的用戶留存率會自然提升。他并沒有正面回答現(xiàn)在kimi的用戶留存率為多少,只表示這個數(shù)據(jù)的提升需要“永無止境”。

不過,《財富》對話的多位投資人以及Kimi競爭對手均表示,目前并未體驗到k0-math產(chǎn)品,對其功能和實際效果無法給出評價。

Kimi不斷推出新產(chǎn)品反映了中美人工智能領(lǐng)域的競爭。業(yè)界普遍認為,人工智能主要由算法、算力和數(shù)據(jù)三大要素組成,在算力層面,美國擁有絕對優(yōu)勢;在算法層面,中國公司正在逐步追趕;而在數(shù)據(jù)和應(yīng)用場景層,中國擁有將人工智能應(yīng)用到各個場景中,并獲得有效使用數(shù)據(jù)的能力,這是一大優(yōu)勢。(財富中文網(wǎng))

在財富Plus,網(wǎng)友們對這篇文章發(fā)表了許多有深度和思想的觀點。一起來看看吧。也歡迎你加入我們,談?wù)勀愕南敕。今日其他熱議話題:

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港