當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-01-16 07:07:47 瀏覽：101次

導(dǎo)讀：Skywork o1與4o已正式上線(xiàn)web與App端。作者｜栗子“雖然超級(jí)應(yīng)用尚未出現(xiàn)，但AI的實(shí)際滲透率已經(jīng)不低，并且將在2025年繼續(xù)井噴式增長(zhǎng)�！毙履甑谝惶�，李彥宏就以百度全員信的方式說(shuō)出了自己對(duì)2025年AI發(fā)展趨勢(shì)的判斷。盡管Scaling Law在部分層面已經(jīng)放緩，但AI必然依舊是2025年科技的主旋律之一，超級(jí)AI原生應(yīng)用依舊是賽道上各位玩家所追求的目標(biāo)。經(jīng)歷過(guò)2023與2024年的“百模 ......

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

Skywork o1與4o已正式上線(xiàn)web與App端。

作者｜栗子

“雖然超級(jí)應(yīng)用尚未出現(xiàn)，但AI的實(shí)際滲透率已經(jīng)不低，并且將在2025年繼續(xù)井噴式增長(zhǎng)�！�

新年第一天，李彥宏就以百度全員信的方式說(shuō)出了自己對(duì)2025年AI發(fā)展趨勢(shì)的判斷。

盡管Scaling Law在部分層面已經(jīng)放緩，但AI必然依舊是2025年科技的主旋律之一，超級(jí)AI原生應(yīng)用依舊是賽道上各位玩家所追求的目標(biāo)。

經(jīng)歷過(guò)2023與2024年的“百模大戰(zhàn)”探索之后，以“AI六小龍”為代表的各位玩家逐漸走上了不同的技術(shù)路線(xiàn)：智譜專(zhuān)注于Agent的研發(fā)與應(yīng)用；MiniMax致力于多模態(tài)大模型；百川智能專(zhuān)注于自然語(yǔ)言處理；月之暗面不斷提升AI助手的交互能力；階躍星辰持續(xù)優(yōu)化算法和算力；零一萬(wàn)物則專(zhuān)注于探索超大模型的知識(shí)遷移。

但在六小龍之外，有一家實(shí)力不容小覷的AI公司一直非常低調(diào)，那就是昆侖萬(wàn)維。

去年11月28日，昆侖萬(wàn)維創(chuàng)始人周亞輝的一條朋友圈在網(wǎng)絡(luò)上瘋傳。周亞輝不僅認(rèn)可字節(jié)在AI上的戰(zhàn)略布局，并且給昆侖萬(wàn)維在過(guò)去一年的AI戰(zhàn)略也打出滿(mǎn)分，原因是足夠差異化，找到了小而大美的發(fā)展空間。

周亞輝所言非虛。

就在周亞輝發(fā)布朋友圈的前幾天，昆侖萬(wàn)維先后發(fā)布了天工大模型4.0中的推理模型“o1”（Skywork o1）和端到端語(yǔ)音模型“4o”（Skywork 4o）及實(shí)時(shí)語(yǔ)音對(duì)話(huà)助手“Skyo”。

其中，Skywork o1是國(guó)內(nèi)首款具備中文復(fù)雜思考推理能力的系列模型，比智譜在12月31日宣布上線(xiàn)的類(lèi)o1推理模型GLM-Zero-Preview早問(wèn)世一個(gè)多月。

目前，這兩款模型和語(yǔ)音產(chǎn)品正式在Web端與App端全面上線(xiàn)，直接可用。它們所展現(xiàn)的強(qiáng)大能力仿佛在向外界傳遞一個(gè)有力的聲音：

這一次，不再低調(diào)的昆侖萬(wàn)維，在2025開(kāi)年之際給大模型帶來(lái)了新驚喜。

1.不只是升級(jí)，更是AI革新

最受期待的必然是天工大模型4.0的Skywork o1推理模型。

去年9月，OpenAI第一次向世界展現(xiàn)了推理模型o1的強(qiáng)大。盡管當(dāng)時(shí)的o1僅有o1-preview和o1-mini兩個(gè)版本，但在物理、化學(xué)、數(shù)學(xué)、邏輯等多個(gè)維度的基準(zhǔn)測(cè)試中，水平都已超過(guò)了GPT-4o模型。隨后在12月，OpenAI發(fā)布了正式版o1模型。

與其他模型相比，o1的最大特點(diǎn)是，它能通過(guò)類(lèi)似人類(lèi)的推理過(guò)程來(lái)逐步分析問(wèn)題，直至得出正確結(jié)論。

對(duì)比OpenAI，昆侖萬(wàn)維的Skywork o1模型更側(cè)重于中文支持和推理速度，在中文邏輯和推理類(lèi)問(wèn)題上表現(xiàn)更加突出。

先上一個(gè)簡(jiǎn)單的雞兔同籠問(wèn)題。Skywork o1用最常規(guī)的二元一次方程輕松解答。

但雞兔同籠對(duì)于AI來(lái)說(shuō)可能太簡(jiǎn)單了，看不出來(lái)Skywork o1的推理與運(yùn)算能力，再來(lái)一個(gè)數(shù)學(xué)經(jīng)典的德梅齊里亞克的砝碼問(wèn)題。

span style="font-size:18px">Skywork o1只用了52秒就給出了正確答案。

再上點(diǎn)強(qiáng)度，給它出一道邏輯推理題。

我們發(fā)現(xiàn)，Skywork o1可以根據(jù)題面給出自己的答案，并呈現(xiàn)了完整的思考過(guò)程。只是回答稍微有點(diǎn)瑕疵（因?yàn)閲?yán)格按照題面要求，甲乙二人是不能做出“指路”這個(gè)動(dòng)作的）。我們?cè)偕晕⒁笏幌隆?br/>

很快，Skywork o1給出了更為標(biāo)準(zhǔn)的答案。

別小看這道看似簡(jiǎn)單的邏輯推理題。它把智譜前些天剛剛上線(xiàn)的GLM-Zero-Preview直接整不會(huì)了。

對(duì)比之下，Skywork o1在中文邏輯推理和計(jì)算方面的表現(xiàn)確實(shí)更加優(yōu)異。

總結(jié)下來(lái)，相較于此前（長(zhǎng)文本任務(wù)）大模型，無(wú)論是常識(shí)推理問(wèn)題、邏輯推理問(wèn)題、數(shù)學(xué)推理問(wèn)題、倫理決策問(wèn)題、還是“弱智”（類(lèi)似腦筋急轉(zhuǎn)彎）邏輯陷阱問(wèn)題等，Skywork o1都處理的游刃有余。

再來(lái)看天工大模型4.0中的端到端語(yǔ)音模型Skywork 4o。

同樣是在去年，OpenAI在5月的發(fā)布會(huì)上展示了4o多模態(tài)模型。觀(guān)眾們對(duì)它最深的印象就是可以像打電話(huà)一樣和該模型進(jìn)行流暢的語(yǔ)音交互，而不會(huì)像siri一樣感覺(jué)自己在和一個(gè)語(yǔ)音助手對(duì)話(huà)。

在最新的天工App里，Skywork 4o是作為實(shí)時(shí)語(yǔ)音對(duì)話(huà)助手“Skyo”來(lái)實(shí)現(xiàn)的，目前在iOS與安卓系統(tǒng)上已全面上線(xiàn)。

Skyo的交互界面也同樣是熟悉的語(yǔ)音電話(huà)，聲音默認(rèn)是男聲，聽(tīng)上去像是個(gè)20～30歲有一定社會(huì)經(jīng)驗(yàn)的職場(chǎng)人，后續(xù)版本還將支持修改和自定義。在整體的測(cè)試中，Skyo能夠在1秒內(nèi)回復(fù)用戶(hù)的問(wèn)題。并且它的回答基本都是準(zhǔn)確的，沒(méi)有出現(xiàn)對(duì)話(huà)類(lèi)大模型經(jīng)常會(huì)遇到的幻覺(jué)問(wèn)題。

不難發(fā)現(xiàn)，無(wú)論是o1還是4o，都能夠?qū)τ脩?hù)的問(wèn)題進(jìn)行流暢的回應(yīng)并給出正確答案，尤其是Skywork o1，給用戶(hù)帶來(lái)了完全不輸OpenAI的使用感受，甚至還有驚喜。

作為國(guó)內(nèi)首款具備中文邏輯推理能力的模型，顯然，Skywork o1的率先上線(xiàn)意味著中國(guó)人工智能領(lǐng)域的重要突破，填補(bǔ)了國(guó)內(nèi)在這一領(lǐng)域的空白。

不夸張的說(shuō)，天工大模型4.0所帶來(lái)的o1與4o不只是產(chǎn)品能力的升級(jí)，更是市場(chǎng)所期待的AI革新。

2.時(shí)間與技術(shù)的雙重領(lǐng)先

Skywork o1與Skywork 4o之所以能夠率先推出并取得同類(lèi)產(chǎn)品領(lǐng)先的實(shí)際效果反饋，離不開(kāi)它在技術(shù)層面的優(yōu)勢(shì)。

不同于現(xiàn)有的復(fù)現(xiàn)OpenAI o1模型的工作，Skywork o1真正讓模型擁有了思考和反思帶來(lái)的推理能力的提升。進(jìn)階版復(fù)雜人類(lèi)思考能力的解鎖無(wú)疑會(huì)成為大模型在垂類(lèi)領(lǐng)域發(fā)展的強(qiáng)大助推器，對(duì)于醫(yī)療、金融等專(zhuān)業(yè)領(lǐng)域意義重大。

在去年11月發(fā)布的產(chǎn)品介紹中，昆侖萬(wàn)維介紹了Skywork o1的天工三個(gè)階段自研的訓(xùn)練方案：

推理反思能力訓(xùn)練：通過(guò)自研的多智能體體系構(gòu)造高質(zhì)量的分步思考，反思和驗(yàn)證數(shù)據(jù)。通過(guò)高質(zhì)量的、多樣性的長(zhǎng)思考數(shù)據(jù)對(duì)基座模型進(jìn)行繼續(xù)預(yù)訓(xùn)練和監(jiān)督微調(diào)。

推理能力強(qiáng)化學(xué)習(xí)：團(tuán)隊(duì)研發(fā)了最新的適配分步推理強(qiáng)化的Skywork o1 Process Reward Model（PRM）。實(shí)驗(yàn)證明Skywork-PRM可有效的捕捉到復(fù)雜推理任務(wù)中間步驟和思考步驟對(duì)最終答案的影響。結(jié)合自研分步推理強(qiáng)化算法進(jìn)一步加強(qiáng)模型推理和思考能力。

推理planning：基于天工自研的Q*線(xiàn)上推理算法配合模型在線(xiàn)思考，并尋找最佳推理路徑。這也是全球首次將Q*算法實(shí)現(xiàn)和公開(kāi)。Q*算法落地也大大提升了模型線(xiàn)上推理能力。

自研的訓(xùn)練方案之下，Skywork o1獲得了同級(jí)別領(lǐng)先的模型能力。

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

標(biāo)準(zhǔn)數(shù)學(xué)基準(zhǔn)測(cè)試結(jié)果

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

代碼基準(zhǔn)測(cè)試結(jié)果

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

典型邏輯運(yùn)算推理測(cè)試結(jié)果

從這幾個(gè)結(jié)果不難發(fā)現(xiàn)，與目前市面上其他幾家主流大模型相比，Skywork o1的能力顯著優(yōu)于常規(guī)通用大模型，表現(xiàn)僅次于o1-mini。

需要指出的是，除了昆侖萬(wàn)維之外，智譜（GLM-Zero-Preview）和Kimi（k1視覺(jué)思考模型）目前也已經(jīng)發(fā)布了o1推理模型。

只不過(guò)在前面的測(cè)試中，GLM-Zero-Preview在一個(gè)看似簡(jiǎn)單的推理問(wèn)題上栽了跟頭。而Kimi在經(jīng)典的“愛(ài)因斯坦的邏輯題”上，不僅分了兩次才回答完，而且給出的答案也并不正確。

作為國(guó)內(nèi)率先發(fā)布的o1模型，昆侖萬(wàn)維基于Llama 3.1 8B的開(kāi)源模型訓(xùn)練了Skywork o1 Open。該模型在同生態(tài)位開(kāi)源模型中評(píng)測(cè)指標(biāo)大幅提升達(dá)到SOTA水平，并解鎖了許多輕量級(jí)模型無(wú)法解決的復(fù)雜數(shù)學(xué)任務(wù)，幫助國(guó)內(nèi)開(kāi)源社區(qū)加速?gòu)?fù)現(xiàn)o1的進(jìn)程。

而在4o模型方面，不同于o1模型，由于4o模型亮相更早，所以國(guó)內(nèi)也已有不少公司在去年發(fā)布了類(lèi)似的模型。例如智譜和階躍星辰都已經(jīng)發(fā)布了GLM-4-Voice和Step-1o-Audio模型。

智譜的GLM-4-Voice模型上線(xiàn)App的時(shí)間較早，并且也同樣在模型中加入了多模態(tài)能力，可以直接在語(yǔ)音對(duì)話(huà)過(guò)程中切換成視頻模型來(lái)識(shí)別屏幕中的物體。但在測(cè)試過(guò)程中筆者發(fā)現(xiàn)，識(shí)別會(huì)受光線(xiàn)和物體本身的影響，偶爾會(huì)出現(xiàn)識(shí)別不出或錯(cuò)誤的情況，并且語(yǔ)音交流偶爾也會(huì)出現(xiàn)中斷。

相對(duì)而言，昆侖萬(wàn)維的Skywork 4o更專(zhuān)注于語(yǔ)音的模型能力建設(shè)�；诶鋈f(wàn)維自身長(zhǎng)期在語(yǔ)音和音樂(lè)大模型方面的經(jīng)驗(yàn)，以及大量語(yǔ)音數(shù)據(jù)積累，自研端到端鏈路，讓Skywork 4o在高強(qiáng)度對(duì)話(huà)交互中仍能保持穩(wěn)定性和流暢性。

Skyo利用超過(guò)百萬(wàn)小時(shí)的語(yǔ)音數(shù)據(jù)進(jìn)行了大模型預(yù)訓(xùn)練，學(xué)習(xí)到了真實(shí)世界各種場(chǎng)景、不同風(fēng)格的說(shuō)話(huà)表達(dá)方式，在回復(fù)時(shí)的語(yǔ)速、語(yǔ)調(diào)、情感方面不再干巴巴，變得更加自然、更加多變、更有人情味。

也得益于端到端建模，Skyo能夠像人類(lèi)一樣，能聽(tīng)懂用戶(hù)的語(yǔ)音，并提供了高質(zhì)量交互能力（包括極低延遲、實(shí)時(shí)打斷）自然、流暢的互動(dòng)體驗(yàn)，用戶(hù)也能快速獲得智能的語(yǔ)音回應(yīng)。

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0

上圖為Skyo所采用的語(yǔ)音對(duì)話(huà)框架，專(zhuān)為全雙工端到端語(yǔ)音對(duì)話(huà)設(shè)計(jì)，方便用戶(hù)通過(guò)自然的對(duì)話(huà)方式與智能系統(tǒng)交流。整個(gè)框架可以分為以下幾步：

語(yǔ)音輸入（Speech Query）與語(yǔ)音編碼（Speech Encoder）：用戶(hù)通過(guò)語(yǔ)音表達(dá)自己的問(wèn)題或請(qǐng)求，這些語(yǔ)音被系統(tǒng)接收，作為對(duì)話(huà)的起點(diǎn)。系統(tǒng)利用語(yǔ)音編碼器將接收到的語(yǔ)音信號(hào)轉(zhuǎn)換為語(yǔ)義表示。

適配轉(zhuǎn)換（Adapter）：語(yǔ)音的語(yǔ)義表示通過(guò)適配模塊的模態(tài)對(duì)齊被調(diào)整為大語(yǔ)言模型（LLM）能夠理解的格式，為語(yǔ)音與文本語(yǔ)義的無(wú)縫對(duì)接提供支持。

大語(yǔ)言模型（LLM）：經(jīng)過(guò)適配的語(yǔ)音信息被輸入到核心智能模型（LLM），模型通過(guò)多模態(tài)的處理能力理解語(yǔ)音意圖，并生成相應(yīng)的解決方案或回答。

語(yǔ)音輸出（Speech Token）：系統(tǒng)支持直接輸出語(yǔ)音令牌（Speech Token），通過(guò)擴(kuò)散模型將這些令牌還原為真實(shí)語(yǔ)音，實(shí)現(xiàn)從語(yǔ)音輸入到語(yǔ)音輸出的端到端交互。

更重要的是，基于天工AI的大模型技術(shù)能力和AI搜索功能，Skyo能克服大模型幻覺(jué)問(wèn)題，在對(duì)話(huà)中回復(fù)真實(shí)內(nèi)容。

而上述這些Skywork o1與4o的能力，用戶(hù)都已經(jīng)可以在天工大模型4.0的web端或App端免費(fèi)體驗(yàn)到。

3.小而大美昆侖萬(wàn)維的生態(tài)位

2024年以來(lái)，昆侖萬(wàn)維的天工AI持續(xù)進(jìn)化，陸續(xù)發(fā)布了“天工2.0”“天工3.0”，以及近期的“天工大模型4.0”Skywork 4o和Skywork o1。

在「甲子光年」看來(lái)，這一過(guò)程不僅是昆侖萬(wàn)維構(gòu)建AI技術(shù)棧的必經(jīng)路線(xiàn)，更是昆侖萬(wàn)維貫徹“All in AGI 與 AIGC” 戰(zhàn)略的重要舉措。因?yàn)樵谶@一過(guò)程中，昆侖萬(wàn)維基于天工大模型能力推出了一系列性能較為強(qiáng)大的模型產(chǎn)品，逐步完成在AI搜索、AI音樂(lè)、AI社交、AI視頻等領(lǐng)域的布局。

對(duì)于昆侖萬(wàn)維的AI戰(zhàn)略，周亞輝在朋友圈上給出了滿(mǎn)分的評(píng)價(jià)。他認(rèn)為昆侖萬(wàn)維找到了屬于自己“小而大美”的空間。而這種空間背后，代表著差異化與垂直化。

與國(guó)內(nèi)很多AI新銳公司和巨頭公司不同，在發(fā)展AI這件事上，昆侖萬(wàn)維并沒(méi)有選擇在大模型和應(yīng)用層全面鋪開(kāi)，而是深耕垂直領(lǐng)域，打造屬于自己的生態(tài)位。

從PC時(shí)代到AI時(shí)代，昆侖萬(wàn)維的優(yōu)勢(shì)是基于其多年在游戲、搜索、社交娛樂(lè)等等業(yè)務(wù)的積累。無(wú)論在訓(xùn)練數(shù)據(jù)還是在產(chǎn)品洞察上，昆侖萬(wàn)維都有著更深的認(rèn)識(shí)，從而打造差異化的產(chǎn)品優(yōu)勢(shì)。

事實(shí)上，通過(guò)前文我們對(duì)Skywork o1與4o的實(shí)際測(cè)試，這種差異化與垂直化打法，已經(jīng)開(kāi)始讓昆侖萬(wàn)維在產(chǎn)品能力上實(shí)現(xiàn)領(lǐng)跑，甚至給用戶(hù)們帶來(lái)了不遜于OpenAI等全球頂級(jí)的產(chǎn)品體驗(yàn)。

此外，在探索商業(yè)化賽道上，昆侖萬(wàn)維也選擇聚焦于AI搜索、AI社交、AI游戲、AI短劇等細(xì)分市場(chǎng)，憑借多年積累的業(yè)務(wù)經(jīng)驗(yàn)和數(shù)據(jù)壁壘，推出更具競(jìng)爭(zhēng)力的AI產(chǎn)品和服務(wù)。

一直以來(lái)，外界對(duì)昆侖萬(wàn)維的認(rèn)知都是“低調(diào)干大事”。

例如2023年8月，昆侖萬(wàn)維就推出了國(guó)內(nèi)第一個(gè)AI搜索引擎天工AI搜索。昆侖萬(wàn)維的AI能力在過(guò)去很長(zhǎng)一段時(shí)間里都被人低估。

但如今，昆侖萬(wàn)維向外界展示出在AI技術(shù)上卓越的創(chuàng)新能力，從天工1.0到天工4.0，模型的語(yǔ)義理解、邏輯推理等能力顯著提升。

特別是Skywork o1，昆侖萬(wàn)維通過(guò)自研訓(xùn)練方案等，進(jìn)一步提升了模型的輸出質(zhì)量和推理能力。這種技術(shù)上的突破，為昆侖萬(wàn)維在專(zhuān)業(yè)領(lǐng)域如學(xué)術(shù)、金融等提供了強(qiáng)大的技術(shù)支持，同時(shí)也為其在AI領(lǐng)域的持續(xù)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。

而此次Skywork o1和4o的全量上線(xiàn)，不僅展現(xiàn)了昆侖萬(wàn)維“All in AGI 與 AIGC”的戰(zhàn)略方向，補(bǔ)足了完整的AI技術(shù)棧，更提升了其在人工智能領(lǐng)域的競(jìng)爭(zhēng)力，為通用人工智能的發(fā)展貢獻(xiàn)了力量。

「甲子光年」認(rèn)為，昆侖萬(wàn)維在AI戰(zhàn)略上的差異化與垂直化，是其能夠激烈的市場(chǎng)競(jìng)爭(zhēng)中立足的根本原因。通過(guò)深耕垂直領(lǐng)域和技術(shù)創(chuàng)新，昆侖萬(wàn)維不僅在特定市場(chǎng)中積累了豐富的經(jīng)驗(yàn)和用戶(hù)基礎(chǔ)，還構(gòu)建起了強(qiáng)大的技術(shù)壁壘和競(jìng)爭(zhēng)優(yōu)勢(shì)。這種獨(dú)特的戰(zhàn)略定位和發(fā)展路徑，為昆侖萬(wàn)維在AI時(shí)代的發(fā)展提供了廣闊的空間和無(wú)限的可能。

還是那句話(huà)，今天以后，“小而大美”的昆侖萬(wàn)維不再低調(diào)。

2025大模型的新驚喜：昆侖萬(wàn)維全面上線(xiàn)天工大模型4.0