展會(huì)信息港展會(huì)大全

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-01-16 07:07:47   瀏覽:101次  

導(dǎo)讀:Skywork o1與4o已正式上線(xiàn)web與App端。作者|栗子“雖然超級(jí)應(yīng)用尚未出現(xiàn),但AI的實(shí)際滲透率已經(jīng)不低,并且將在2025年繼續(xù)井噴式增長(zhǎng)!毙履甑谝惶,李彥宏就以百度全員信的方式說(shuō)出了自己對(duì)2025年AI發(fā)展趨勢(shì)的判斷。盡管Scaling Law在部分層面已經(jīng)放緩,但AI必然依舊是2025年科技的主旋律之一,超級(jí)AI原生應(yīng)用依舊是賽道上各位玩家所追求的目標(biāo)。經(jīng)歷過(guò)2023與2024年的“百模 ......

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

Skywork o1與4o已正式上線(xiàn)web與App端。

作者|栗子

“雖然超級(jí)應(yīng)用尚未出現(xiàn),但AI的實(shí)際滲透率已經(jīng)不低,并且將在2025年繼續(xù)井噴式增長(zhǎng)!

新年第一天,李彥宏就以百度全員信的方式說(shuō)出了自己對(duì)2025年AI發(fā)展趨勢(shì)的判斷。

盡管Scaling Law在部分層面已經(jīng)放緩,但AI必然依舊是2025年科技的主旋律之一,超級(jí)AI原生應(yīng)用依舊是賽道上各位玩家所追求的目標(biāo)。

經(jīng)歷過(guò)2023與2024年的“百模大戰(zhàn)”探索之后,以“AI六小龍”為代表的各位玩家逐漸走上了不同的技術(shù)路線(xiàn):智譜專(zhuān)注于Agent的研發(fā)與應(yīng)用;MiniMax致力于多模態(tài)大模型;百川智能專(zhuān)注于自然語(yǔ)言處理;月之暗面不斷提升AI助手的交互能力;階躍星辰持續(xù)優(yōu)化算法和算力;零一萬(wàn)物則專(zhuān)注于探索超大模型的知識(shí)遷移。

但在六小龍之外,有一家實(shí)力不容小覷的AI公司一直非常低調(diào),那就是昆侖萬(wàn)維。

去年11月28日,昆侖萬(wàn)維創(chuàng)始人周亞輝的一條朋友圈在網(wǎng)絡(luò)上瘋傳。周亞輝不僅認(rèn)可字節(jié)在AI上的戰(zhàn)略布局,并且給昆侖萬(wàn)維在過(guò)去一年的AI戰(zhàn)略也打出滿(mǎn)分,原因是足夠差異化,找到了小而大美的發(fā)展空間。

周亞輝所言非虛。

就在周亞輝發(fā)布朋友圈的前幾天,昆侖萬(wàn)維先后發(fā)布了天工大模型4.0中的推理模型“o1”(Skywork o1)和端到端語(yǔ)音模型“4o”(Skywork 4o)及實(shí)時(shí)語(yǔ)音對(duì)話(huà)助手“Skyo”。

其中,Skywork o1是國(guó)內(nèi)首款具備中文復(fù)雜思考推理能力的系列模型,比智譜在12月31日宣布上線(xiàn)的類(lèi)o1推理模型GLM-Zero-Preview早問(wèn)世一個(gè)多月。

目前,這兩款模型和語(yǔ)音產(chǎn)品正式在Web端與App端全面上線(xiàn),直接可用。它們所展現(xiàn)的強(qiáng)大能力仿佛在向外界傳遞一個(gè)有力的聲音:

這一次,不再低調(diào)的昆侖萬(wàn)維,在2025開(kāi)年之際給大模型帶來(lái)了新驚喜。

1.不只是升級(jí),更是AI革新

最受期待的必然是天工大模型4.0的Skywork o1推理模型。

去年9月,OpenAI第一次向世界展現(xiàn)了推理模型o1的強(qiáng)大。盡管當(dāng)時(shí)的o1僅有o1-preview和o1-mini兩個(gè)版本,但在物理、化學(xué)、數(shù)學(xué)、邏輯等多個(gè)維度的基準(zhǔn)測(cè)試中,水平都已超過(guò)了GPT-4o模型。隨后在12月,OpenAI發(fā)布了正式版o1模型。

與其他模型相比,o1的最大特點(diǎn)是,它能通過(guò)類(lèi)似人類(lèi)的推理過(guò)程來(lái)逐步分析問(wèn)題,直至得出正確結(jié)論。

對(duì)比OpenAI,昆侖萬(wàn)維的Skywork o1模型更側(cè)重于中文支持和推理速度,在中文邏輯和推理類(lèi)問(wèn)題上表現(xiàn)更加突出。

先上一個(gè)簡(jiǎn)單的雞兔同籠問(wèn)題。Skywork o1用最常規(guī)的二元一次方程輕松解答。

但雞兔同籠對(duì)于AI來(lái)說(shuō)可能太簡(jiǎn)單了,看不出來(lái)Skywork o1的推理與運(yùn)算能力,再來(lái)一個(gè)數(shù)學(xué)經(jīng)典的德梅齊里亞克的砝碼問(wèn)題。

span style="font-size:18px">Skywork o1只用了52秒就給出了正確答案。

再上點(diǎn)強(qiáng)度,給它出一道邏輯推理題。

我們發(fā)現(xiàn),Skywork o1可以根據(jù)題面給出自己的答案,并呈現(xiàn)了完整的思考過(guò)程。只是回答稍微有點(diǎn)瑕疵(因?yàn)閲?yán)格按照題面要求,甲乙二人是不能做出“指路”這個(gè)動(dòng)作的)。我們?cè)偕晕⒁笏幌隆?br/>

很快,Skywork o1給出了更為標(biāo)準(zhǔn)的答案。

別小看這道看似簡(jiǎn)單的邏輯推理題。它把智譜前些天剛剛上線(xiàn)的GLM-Zero-Preview直接整不會(huì)了。

對(duì)比之下,Skywork o1在中文邏輯推理和計(jì)算方面的表現(xiàn)確實(shí)更加優(yōu)異。

總結(jié)下來(lái),相較于此前(長(zhǎng)文本任務(wù))大模型,無(wú)論是常識(shí)推理問(wèn)題、邏輯推理問(wèn)題、數(shù)學(xué)推理問(wèn)題、倫理決策問(wèn)題、還是“弱智”(類(lèi)似腦筋急轉(zhuǎn)彎)邏輯陷阱問(wèn)題等,Skywork o1都處理的游刃有余。

再來(lái)看天工大模型4.0中的端到端語(yǔ)音模型Skywork 4o。

同樣是在去年,OpenAI在5月的發(fā)布會(huì)上展示了4o多模態(tài)模型。觀(guān)眾們對(duì)它最深的印象就是可以像打電話(huà)一樣和該模型進(jìn)行流暢的語(yǔ)音交互,而不會(huì)像siri一樣感覺(jué)自己在和一個(gè)語(yǔ)音助手對(duì)話(huà)。

在最新的天工App里,Skywork 4o是作為實(shí)時(shí)語(yǔ)音對(duì)話(huà)助手“Skyo”來(lái)實(shí)現(xiàn)的,目前在iOS與安卓系統(tǒng)上已全面上線(xiàn)。

Skyo的交互界面也同樣是熟悉的語(yǔ)音電話(huà),聲音默認(rèn)是男聲,聽(tīng)上去像是個(gè)20~30歲有一定社會(huì)經(jīng)驗(yàn)的職場(chǎng)人,后續(xù)版本還將支持修改和自定義。在整體的測(cè)試中,Skyo能夠在1秒內(nèi)回復(fù)用戶(hù)的問(wèn)題。并且它的回答基本都是準(zhǔn)確的,沒(méi)有出現(xiàn)對(duì)話(huà)類(lèi)大模型經(jīng)常會(huì)遇到的幻覺(jué)問(wèn)題。

不難發(fā)現(xiàn),無(wú)論是o1還是4o,都能夠?qū)τ脩?hù)的問(wèn)題進(jìn)行流暢的回應(yīng)并給出正確答案,尤其是Skywork o1,給用戶(hù)帶來(lái)了完全不輸OpenAI的使用感受,甚至還有驚喜。

作為國(guó)內(nèi)首款具備中文邏輯推理能力的模型,顯然,Skywork o1的率先上線(xiàn)意味著中國(guó)人工智能領(lǐng)域的重要突破,填補(bǔ)了國(guó)內(nèi)在這一領(lǐng)域的空白。

不夸張的說(shuō),天工大模型4.0所帶來(lái)的o1與4o不只是產(chǎn)品能力的升級(jí),更是市場(chǎng)所期待的AI革新。

2.時(shí)間與技術(shù)的雙重領(lǐng)先

Skywork o1與Skywork 4o之所以能夠率先推出并取得同類(lèi)產(chǎn)品領(lǐng)先的實(shí)際效果反饋,離不開(kāi)它在技術(shù)層面的優(yōu)勢(shì)。

不同于現(xiàn)有的復(fù)現(xiàn)OpenAI o1模型的工作,Skywork o1真正讓模型擁有了思考和反思帶來(lái)的推理能力的提升。進(jìn)階版復(fù)雜人類(lèi)思考能力的解鎖無(wú)疑會(huì)成為大模型在垂類(lèi)領(lǐng)域發(fā)展的強(qiáng)大助推器,對(duì)于醫(yī)療、金融等專(zhuān)業(yè)領(lǐng)域意義重大。

在去年11月發(fā)布的產(chǎn)品介紹中,昆侖萬(wàn)維介紹了Skywork o1的天工三個(gè)階段自研的訓(xùn)練方案:

推理反思能力訓(xùn)練:通過(guò)自研的多智能體體系構(gòu)造高質(zhì)量的分步思考,反思和驗(yàn)證數(shù)據(jù)。通過(guò)高質(zhì)量的、多樣性的長(zhǎng)思考數(shù)據(jù)對(duì)基座模型進(jìn)行繼續(xù)預(yù)訓(xùn)練和監(jiān)督微調(diào)。

推理能力強(qiáng)化學(xué)習(xí):團(tuán)隊(duì)研發(fā)了最新的適配分步推理強(qiáng)化的Skywork o1 Process Reward Model(PRM)。實(shí)驗(yàn)證明Skywork-PRM可有效的捕捉到復(fù)雜推理任務(wù)中間步驟和思考步驟對(duì)最終答案的影響。結(jié)合自研分步推理強(qiáng)化算法進(jìn)一步加強(qiáng)模型推理和思考能力。

推理planning:基于天工自研的Q*線(xiàn)上推理算法配合模型在線(xiàn)思考,并尋找最佳推理路徑。這也是全球首次將Q*算法實(shí)現(xiàn)和公開(kāi)。Q*算法落地也大大提升了模型線(xiàn)上推理能力。

自研的訓(xùn)練方案之下,Skywork o1獲得了同級(jí)別領(lǐng)先的模型能力。

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

標(biāo)準(zhǔn)數(shù)學(xué)基準(zhǔn)測(cè)試結(jié)果

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

代碼基準(zhǔn)測(cè)試結(jié)果

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

典型邏輯運(yùn)算推理測(cè)試結(jié)果

從這幾個(gè)結(jié)果不難發(fā)現(xiàn),與目前市面上其他幾家主流大模型相比,Skywork o1的能力顯著優(yōu)于常規(guī)通用大模型,表現(xiàn)僅次于o1-mini。

需要指出的是,除了昆侖萬(wàn)維之外,智譜(GLM-Zero-Preview)和Kimi(k1視覺(jué)思考模型)目前也已經(jīng)發(fā)布了o1推理模型。

只不過(guò)在前面的測(cè)試中,GLM-Zero-Preview在一個(gè)看似簡(jiǎn)單的推理問(wèn)題上栽了跟頭。而Kimi在經(jīng)典的“愛(ài)因斯坦的邏輯題”上,不僅分了兩次才回答完,而且給出的答案也并不正確。

作為國(guó)內(nèi)率先發(fā)布的o1模型,昆侖萬(wàn)維基于Llama 3.1 8B的開(kāi)源模型訓(xùn)練了Skywork o1 Open。該模型在同生態(tài)位開(kāi)源模型中評(píng)測(cè)指標(biāo)大幅提升達(dá)到SOTA水平,并解鎖了許多輕量級(jí)模型無(wú)法解決的復(fù)雜數(shù)學(xué)任務(wù),幫助國(guó)內(nèi)開(kāi)源社區(qū)加速?gòu)?fù)現(xiàn)o1的進(jìn)程。

而在4o模型方面,不同于o1模型,由于4o模型亮相更早,所以國(guó)內(nèi)也已有不少公司在去年發(fā)布了類(lèi)似的模型。例如智譜和階躍星辰都已經(jīng)發(fā)布了GLM-4-Voice和Step-1o-Audio模型。

智譜的GLM-4-Voice模型上線(xiàn)App的時(shí)間較早,并且也同樣在模型中加入了多模態(tài)能力,可以直接在語(yǔ)音對(duì)話(huà)過(guò)程中切換成視頻模型來(lái)識(shí)別屏幕中的物體。但在測(cè)試過(guò)程中筆者發(fā)現(xiàn),識(shí)別會(huì)受光線(xiàn)和物體本身的影響,偶爾會(huì)出現(xiàn)識(shí)別不出或錯(cuò)誤的情況,并且語(yǔ)音交流偶爾也會(huì)出現(xiàn)中斷。

相對(duì)而言,昆侖萬(wàn)維的Skywork 4o更專(zhuān)注于語(yǔ)音的模型能力建設(shè);诶鋈f(wàn)維自身長(zhǎng)期在語(yǔ)音和音樂(lè)大模型方面的經(jīng)驗(yàn),以及大量語(yǔ)音數(shù)據(jù)積累,自研端到端鏈路,讓Skywork 4o在高強(qiáng)度對(duì)話(huà)交互中仍能保持穩(wěn)定性和流暢性。

Skyo利用超過(guò)百萬(wàn)小時(shí)的語(yǔ)音數(shù)據(jù)進(jìn)行了大模型預(yù)訓(xùn)練,學(xué)習(xí)到了真實(shí)世界各種場(chǎng)景、不同風(fēng)格的說(shuō)話(huà)表達(dá)方式,在回復(fù)時(shí)的語(yǔ)速、語(yǔ)調(diào)、情感方面不再干巴巴,變得更加自然、更加多變、更有人情味。

也得益于端到端建模,Skyo能夠像人類(lèi)一樣,能聽(tīng)懂用戶(hù)的語(yǔ)音,并提供了高質(zhì)量交互能力(包括極低延遲、實(shí)時(shí)打斷)自然、流暢的互動(dòng)體驗(yàn),用戶(hù)也能快速獲得智能的語(yǔ)音回應(yīng)。

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

上圖為Skyo所采用的語(yǔ)音對(duì)話(huà)框架,專(zhuān)為全雙工端到端語(yǔ)音對(duì)話(huà)設(shè)計(jì),方便用戶(hù)通過(guò)自然的對(duì)話(huà)方式與智能系統(tǒng)交流。整個(gè)框架可以分為以下幾步:

語(yǔ)音輸入(Speech Query)與語(yǔ)音編碼(Speech Encoder):用戶(hù)通過(guò)語(yǔ)音表達(dá)自己的問(wèn)題或請(qǐng)求,這些語(yǔ)音被系統(tǒng)接收,作為對(duì)話(huà)的起點(diǎn)。系統(tǒng)利用語(yǔ)音編碼器將接收到的語(yǔ)音信號(hào)轉(zhuǎn)換為語(yǔ)義表示。

適配轉(zhuǎn)換(Adapter):語(yǔ)音的語(yǔ)義表示通過(guò)適配模塊的模態(tài)對(duì)齊被調(diào)整為大語(yǔ)言模型(LLM)能夠理解的格式,為語(yǔ)音與文本語(yǔ)義的無(wú)縫對(duì)接提供支持。

大語(yǔ)言模型(LLM):經(jīng)過(guò)適配的語(yǔ)音信息被輸入到核心智能模型(LLM),模型通過(guò)多模態(tài)的處理能力理解語(yǔ)音意圖,并生成相應(yīng)的解決方案或回答。

語(yǔ)音輸出(Speech Token):系統(tǒng)支持直接輸出語(yǔ)音令牌(Speech Token),通過(guò)擴(kuò)散模型將這些令牌還原為真實(shí)語(yǔ)音,實(shí)現(xiàn)從語(yǔ)音輸入到語(yǔ)音輸出的端到端交互。

更重要的是,基于天工AI的大模型技術(shù)能力和AI搜索功能,Skyo能克服大模型幻覺(jué)問(wèn)題,在對(duì)話(huà)中回復(fù)真實(shí)內(nèi)容。

而上述這些Skywork o1與4o的能力,用戶(hù)都已經(jīng)可以在天工大模型4.0的web端或App端免費(fèi)體驗(yàn)到。

3.小而大美昆侖萬(wàn)維的生態(tài)位

2024年以來(lái),昆侖萬(wàn)維的天工AI持續(xù)進(jìn)化,陸續(xù)發(fā)布了“天工2.0”“天工3.0”,以及近期的“天工大模型4.0”Skywork 4o和Skywork o1。

在「甲子光年」看來(lái),這一過(guò)程不僅是昆侖萬(wàn)維構(gòu)建AI技術(shù)棧的必經(jīng)路線(xiàn),更是昆侖萬(wàn)維貫徹“All in AGI 與 AIGC” 戰(zhàn)略的重要舉措。因?yàn)樵谶@一過(guò)程中,昆侖萬(wàn)維基于天工大模型能力推出了一系列性能較為強(qiáng)大的模型產(chǎn)品,逐步完成在AI搜索、AI音樂(lè)、AI社交、AI視頻等領(lǐng)域的布局。

對(duì)于昆侖萬(wàn)維的AI戰(zhàn)略,周亞輝在朋友圈上給出了滿(mǎn)分的評(píng)價(jià)。他認(rèn)為昆侖萬(wàn)維找到了屬于自己“小而大美”的空間。而這種空間背后,代表著差異化與垂直化。

與國(guó)內(nèi)很多AI新銳公司和巨頭公司不同,在發(fā)展AI這件事上,昆侖萬(wàn)維并沒(méi)有選擇在大模型和應(yīng)用層全面鋪開(kāi),而是深耕垂直領(lǐng)域,打造屬于自己的生態(tài)位。

從PC時(shí)代到AI時(shí)代,昆侖萬(wàn)維的優(yōu)勢(shì)是基于其多年在游戲、搜索、社交娛樂(lè)等等業(yè)務(wù)的積累。無(wú)論在訓(xùn)練數(shù)據(jù)還是在產(chǎn)品洞察上,昆侖萬(wàn)維都有著更深的認(rèn)識(shí),從而打造差異化的產(chǎn)品優(yōu)勢(shì)。

事實(shí)上,通過(guò)前文我們對(duì)Skywork o1與4o的實(shí)際測(cè)試,這種差異化與垂直化打法,已經(jīng)開(kāi)始讓昆侖萬(wàn)維在產(chǎn)品能力上實(shí)現(xiàn)領(lǐng)跑,甚至給用戶(hù)們帶來(lái)了不遜于OpenAI等全球頂級(jí)的產(chǎn)品體驗(yàn)。

此外,在探索商業(yè)化賽道上,昆侖萬(wàn)維也選擇聚焦于AI搜索、AI社交、AI游戲、AI短劇等細(xì)分市場(chǎng),憑借多年積累的業(yè)務(wù)經(jīng)驗(yàn)和數(shù)據(jù)壁壘,推出更具競(jìng)爭(zhēng)力的AI產(chǎn)品和服務(wù)。

一直以來(lái),外界對(duì)昆侖萬(wàn)維的認(rèn)知都是“低調(diào)干大事”。

例如2023年8月,昆侖萬(wàn)維就推出了國(guó)內(nèi)第一個(gè)AI搜索引擎天工AI搜索。昆侖萬(wàn)維的AI能力在過(guò)去很長(zhǎng)一段時(shí)間里都被人低估。

但如今,昆侖萬(wàn)維向外界展示出在AI技術(shù)上卓越的創(chuàng)新能力,從天工1.0到天工4.0,模型的語(yǔ)義理解、邏輯推理等能力顯著提升。

特別是Skywork o1,昆侖萬(wàn)維通過(guò)自研訓(xùn)練方案等,進(jìn)一步提升了模型的輸出質(zhì)量和推理能力。這種技術(shù)上的突破,為昆侖萬(wàn)維在專(zhuān)業(yè)領(lǐng)域如學(xué)術(shù)、金融等提供了強(qiáng)大的技術(shù)支持,同時(shí)也為其在AI領(lǐng)域的持續(xù)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。

而此次Skywork o1和4o的全量上線(xiàn),不僅展現(xiàn)了昆侖萬(wàn)維“All in AGI 與 AIGC”的戰(zhàn)略方向,補(bǔ)足了完整的AI技術(shù)棧,更提升了其在人工智能領(lǐng)域的競(jìng)爭(zhēng)力,為通用人工智能的發(fā)展貢獻(xiàn)了力量。

「甲子光年」認(rèn)為,昆侖萬(wàn)維在AI戰(zhàn)略上的差異化與垂直化,是其能夠激烈的市場(chǎng)競(jìng)爭(zhēng)中立足的根本原因。通過(guò)深耕垂直領(lǐng)域和技術(shù)創(chuàng)新,昆侖萬(wàn)維不僅在特定市場(chǎng)中積累了豐富的經(jīng)驗(yàn)和用戶(hù)基礎(chǔ),還構(gòu)建起了強(qiáng)大的技術(shù)壁壘和競(jìng)爭(zhēng)優(yōu)勢(shì)。這種獨(dú)特的戰(zhàn)略定位和發(fā)展路徑,為昆侖萬(wàn)維在AI時(shí)代的發(fā)展提供了廣闊的空間和無(wú)限的可能。

還是那句話(huà),今天以后,“小而大美”的昆侖萬(wàn)維不再低調(diào)。

2025大模型的新驚喜:昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港