展會信息港展會大全

多模態(tài)成2024 WAIC關鍵詞之一 對話巖芯數(shù)智CEO劉凡平:讓每個設備都擁有個性化的智能
來源:互聯(lián)網   發(fā)布日期:2024-07-08 21:24:52   瀏覽:2364次  

導讀:每經記者:陳婷每經編輯:董興生 作為全球人工智能領域最具影響力的行業(yè)盛會之一,世界人工智能大會(以下簡稱WAIC)可以被視為觀察人工智能發(fā)展的一個窗口。 WAIC 2024剛剛落幕,據《每日經濟新聞》記者持續(xù)幾日在大會現(xiàn)場觀察,多模態(tài)已經是當之無愧的行業(yè)...

每經記者:陳婷每經編輯:董興生

作為全球人工智能領域最具影響力的行業(yè)盛會之一,世界人工智能大會(以下簡稱“WAIC”)可以被視為觀察人工智能發(fā)展的一個窗口。

WAIC 2024剛剛落幕,據《每日經濟新聞》記者持續(xù)幾日在大會現(xiàn)場觀察,多模態(tài)已經是當之無愧的行業(yè)關鍵詞之一。

巖芯數(shù)智CEO劉凡平在接受《每日經濟新聞》記者專訪時表示,就今年而言,大模型的多模態(tài)能力肯定比去年有所進步。“但我認為,整個行業(yè)肯定還要再進步,目前我們已經做到了多模態(tài)的輸入和輸出,距離完全像人一樣地實時人機交互,還要一點時間。”

作為一家以認知智能為基礎的創(chuàng)新企業(yè),巖芯數(shù)智Rock AI在今年1月份發(fā)布了全國首個非Attention機制的Yan架構通用大模型,開辟了非Transformer架構的一條新路徑。這次WAIC,巖芯數(shù)智展示了Yan1.2版本的階段性成果,主要展示Yan架構在更廣泛、更低算力設備上的離線部署及多模態(tài)應用能力。

圖片來源:每經記者 陳婷 攝

巖芯數(shù)智之外,據記者了解,今年WAIC期間,不少從業(yè)者強調了多模態(tài)的重要性。階躍星辰創(chuàng)始人、CEO姜大昕博士表示:“攀登AGI山峰,‘萬億參數(shù)’和‘多模融合’缺一不可。”MiniMax副總裁劉華更是認為,多模態(tài)大模型有望引領新一輪科技革命。

除了存在感居高不下的多模態(tài)外,今年WAIC,對于大模型應用落地的討論更多元了,對于安全治理的見解也更深入了。

今年WAIC大模型更“百花齊放”

官方資料顯示,今年WAIC大會展覽面積超5.2萬平方米,500余家知名企業(yè)、超1500項展品參展,50余款新品首發(fā)首秀,均達歷史最高。此外,近百個大模型集中展現(xiàn),18臺人形機器人矩陣亮相,國內首款全尺寸通用人形機器人開源公版機發(fā)布。

“目前來看,具身智能是挺多的。”劉凡平表示,就當前來看,具身智能的大腦可能還不夠成熟,“未來,具身智能大腦仍需持續(xù)突破”。

大會現(xiàn)場,巖芯數(shù)智的研發(fā)團隊展示了一款部署了Yan1.2多模態(tài)大模型的智能機器人小智,它基于Yan1.2的語音和視覺處理能力,能實時識別環(huán)境、準確理解用戶的模糊指令和意圖,并據此控制其機械軀體高效完成各類復雜任務。

據記者了解,此次“小智”機器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片,在極低算力的設備上實現(xiàn)了多模態(tài)能力。

現(xiàn)場,巖芯數(shù)智的工作人員向記者介紹了“小智”的能力。面對記者,它不但能依據指令向記者鞠躬,還能描述出記者身上穿的衣物特征。此外,小智還有文字類圖像的理解能力,F(xiàn)場,工作人員在小智面前展示了書本的一頁內容,很快,小智就能總結、復述出書本文字的大致意思。

劉凡平用“百花齊放”形容今年的WAIC。他表示:“當大模型真正發(fā)展落地的時候,其實不能再用以前的思維和大眾思維思考這個問題,還是要以未來的視角去思考現(xiàn)在如何演進。”

據記者了解,今年WAIC,創(chuàng)業(yè)公司和大廠各有千秋。

阿里巴巴推出“通義十二時辰”,展示了對話、效率、智能體、視覺四個核心場景中的AI助手能力。此外,快手再次升級視頻生成大模型“可靈”,騰訊則攜混元大模型及多款AI應用亮相。

圖片來源:每經記者 陳婷 攝

與此同時,記者了解到,大會期間,創(chuàng)業(yè)公司階躍星辰首發(fā)了三款Step系列通用大模型新品:Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。

此外,據MiniMax副總裁劉華介紹,MiniMax將海螺AI、星野和MiniMax開放平臺帶到了本次世界人工智能大會。海螺AI可為用戶分析財報、速讀長文、創(chuàng)作文案,聆聽用戶的想法和煩惱,捕捉、理解用戶情緒。

據悉,海螺AI背后接入了MiniMax自研的多模態(tài)大模型,包括萬億參數(shù)MoE大語言模型abab6.5、語音大模型和圖像大模型。

關于未來的探討:讓每個設備都擁有個性化的智能

在本屆WAIC期間,還出現(xiàn)了不少探討AI未來發(fā)展方向的聲音。

劉凡平便有一個更高的目標:就是在實現(xiàn)通用人工智能的同時,將AI與每個人獨特的地方結合在一起,模型具備自主學習能力,讓每個設備都擁有個性化的智能。

“我覺得值得驚艷的突破,不在于模型本身已有的知識能力。”劉凡平表示。雖說大家現(xiàn)在都在比參數(shù)量,但在他看來,更需要比較的是大模型自主學習的能力有多強。

“舉個例子,小蒼蠅、小壁虎、小兔子,它們的腦容量是不一樣的,但它們都具備智能。”劉凡平認為,智能和參數(shù)量沒有直接相關的關系,“因為人與人之間的比較也是這樣,從來不是比較誰了解的知識比誰多,而是比較誰的學習能力更強,所以我認為大模型之后的比較方向應該是自主學習能力。”

劉凡平表示,當大模型具備了自主學習的智能,才是通用人工智能真正的開始,“現(xiàn)有的并不是(自主學習),現(xiàn)有的是一種壓縮算法”。

圖片來源:每經記者 陳婷 攝

對于大模型的未來,MiniMax副總裁劉華也表達了看法。他認為,隨著多模態(tài)大模型技術的持續(xù)演進,文本、語音、視覺這三種模態(tài)的融合模型正逐步邁向成熟。一旦此類大模型技術達到成熟階段,其應用場景將會進一步拓展,實現(xiàn)更多的實際應用。

劉華認為,在短期內,對多模態(tài)大模型的大規(guī)模落地應用預期應保持審慎態(tài)度,不過從中長期來看,堅決不應低估多模態(tài)大模型的重要性,它有望引領新一輪的科技革命。

另據媒體報道,曠視科技聯(lián)合創(chuàng)始人、CTO唐文斌接受采訪時表示,相比語言模型,增加訓練數(shù)據量和參數(shù)量對于計算機視覺模型的提升和收益,目前看并沒有那么大,而多模態(tài)會是大模型的未來。騰訊集團副總裁蔣杰也表示,大模型行業(yè)正經歷從單模態(tài)到多模態(tài),再到全模態(tài)的演進。

劉凡平也注意到了大模型在多模態(tài)能力上的進步,他還表示,與去年相比,今年WAIC在智能化上也有所提升,但基礎變化還不是很大,硬件層次則更難。他推斷,未來人工智能一定會走向硬件化,“當已經完全硬件化的時候,就是完全可商用的時候,任何人都可以用得起”。

他認為,今后大家可能會選用一種全新的算法替代現(xiàn)有的Transformer架構。“Transformer架構依賴的算力非常大,同時數(shù)據量要求非常高,這兩個條件限制了它的發(fā)展。”

記者發(fā)現(xiàn),即便大多選擇從B端出發(fā),但很多大模型公司已有面向C端的動作。

以階躍星辰為例,其在WAIC現(xiàn)場展示了面向C端用戶的自研產品。據報道,階躍星辰副總裁李在接受媒體采訪時表示,目前,C端仍在早期階段,還在進行用戶體驗的收集和打磨,隨著C端模型能力提升,將產生很強的爆發(fā)力。而B端需求相對明確和穩(wěn)定,已經涌現(xiàn)出非常多的確定性應用機會。劉華也表示,MiniMax堅持To B與To C業(yè)務并重的發(fā)展策略。

記者也從巖芯數(shù)智了解到,當前商業(yè)化的重心正逐漸從B端部署到C端,以軟硬件結合的方式搶占C端市場先機。

每日經濟新聞

贊助本站

相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港