文/王新喜
DeepSeek的沖擊效應(yīng)下,ChatGPT首席執(zhí)行官奧爾特曼首次承認(rèn)了,DeepSeek可與ChatGPT相媲美。
奧爾特曼直言,他對(duì)新挑戰(zhàn)者的出現(xiàn)并不感到意外,但DeepSeek出現(xiàn)的時(shí)機(jī)確實(shí)讓他大吃一驚。
現(xiàn)在DeepSeek在國(guó)外攪動(dòng)風(fēng)云的同時(shí),在國(guó)內(nèi)的一系列布局在快速推進(jìn),各大廠商紛紛接入deepSeek,國(guó)產(chǎn)芯片與 AI 大模型的融合發(fā)展正步入快車(chē)道。除龍芯中科外,華為騰、沐曦等多家國(guó)產(chǎn)芯片企業(yè)也相繼宣布適配或上架 DeepSeek 模型服務(wù)。
deepSeek對(duì)國(guó)內(nèi)最大的利好是降低了對(duì)高算力芯片的需求。國(guó)產(chǎn)算力芯片開(kāi)始供不應(yīng)求,摩爾線(xiàn)程、華為騰出貨量都在漲。阿里云和騰訊云也悄悄地從英偉達(dá)轉(zhuǎn)向了國(guó)產(chǎn)芯片。
值得一提的是,華為與DeepSeek的合作,堪稱(chēng)國(guó)產(chǎn)AI領(lǐng)域的“核彈級(jí)”爆炸,而雙方針對(duì)騰芯片的特性,對(duì)DeepSeek模型架構(gòu)進(jìn)行了深度優(yōu)化,重構(gòu)了AI模型的計(jì)算流程,讓算法與硬件實(shí)現(xiàn)了高度適配,國(guó)產(chǎn)芯片與 AI 大模型的融合發(fā)展正步入快車(chē)道。
春節(jié)假期間,DeepSeek用戶(hù)量激增十幾倍不止,但由于推理集群準(zhǔn)備不足,部分功能被迫關(guān)閉。
為滿(mǎn)足用戶(hù)需求,推理端算力部署在加速推進(jìn)。隨著MaaS廠商紛紛接入DeepSeek模型,基于DeepSeek的衍生版本和下游AI應(yīng)用將迎來(lái)爆發(fā)式增長(zhǎng),推理端算力需求將持續(xù)攀升。DeepSeek已開(kāi)始布局多模態(tài)AI,其算力消耗是文本模型的10倍以上。對(duì)國(guó)產(chǎn)算力板卡(如騰910B/910C)的需求將大幅提升。
眾所周知,與英偉達(dá)的高端芯片A100相比,華為算力芯片確實(shí)還差一個(gè)檔次。
在過(guò)去堆算力發(fā)展AI大力出奇跡的模式下,算力直接關(guān)系到數(shù)據(jù)處理分析能力以及人工智能模型的開(kāi)發(fā)水準(zhǔn)。這也是一直以來(lái)國(guó)內(nèi)AI被卡脖子的關(guān)鍵環(huán)節(jié)。
但盡管如此,由于對(duì)國(guó)產(chǎn)替代的需求增長(zhǎng),2024年第四季度,騰在中國(guó)AI芯片市場(chǎng)的份額從3%飆升至27%,而英偉達(dá)的份額則從95%暴跌至58%。
但現(xiàn)在,DeepSeek的橫空出世,加速了國(guó)產(chǎn)算力芯片的替代進(jìn)程,deepSeek R1大模型訓(xùn)練成本僅為美國(guó)同行的1/23,用H800芯片兩個(gè)月跑出比肩GPT-4o的效果,這種效率絞殺直接戳破了硅谷的AI泡沫:中國(guó)AI進(jìn)化已突破“算力邊際效益”臨界點(diǎn),英偉達(dá)芯片不再是必須選項(xiàng)。
尤其是華為騰、摩爾線(xiàn)程等國(guó)內(nèi)企業(yè)不斷的更新迭代,國(guó)產(chǎn)GPU在整體算力上有了很大提升,已經(jīng)可以替代英偉達(dá)A100、H20了。以華為騰910B為例,騰910B無(wú)論是在FP32算力下,還是在FP16算力下,都超過(guò)了英偉達(dá)A100,整體訓(xùn)練性能超出英偉達(dá)A100 20%左右。
在這種情況下,美國(guó)進(jìn)一步收緊英偉達(dá)芯片出口,甚至調(diào)查新加坡,要把所有的路子堵死。但現(xiàn)在國(guó)產(chǎn)廠商已經(jīng)不再需要英偉達(dá)高算力芯片了,DeepSeek以低成本實(shí)現(xiàn)了高水平AI模型,只需要少量高端芯片即可,這給了國(guó)產(chǎn)算力芯片以極大的發(fā)展空間。
華為的紅利期已經(jīng)來(lái)了,華為與DeepSeek的合作,堪稱(chēng)國(guó)產(chǎn)AI領(lǐng)域的“核彈級(jí)”爆炸。雙方針對(duì)騰芯片的特性,對(duì)DeepSeek模型架構(gòu)進(jìn)行了深度優(yōu)化,重構(gòu)了AI模型的計(jì)算流程,讓算法與硬件實(shí)現(xiàn)了高度適配。
數(shù)據(jù)顯示,2023年,華為算力芯片產(chǎn)量只有10萬(wàn)片左右,到了2024年出貨量達(dá)到了數(shù)十萬(wàn)片,F(xiàn)在的登記的需求量已經(jīng)超過(guò)百萬(wàn)片,供需差額太大。與此同時(shí),華為算力芯片的價(jià)格由7萬(wàn)塊錢(qián),增長(zhǎng)了12萬(wàn),漲幅超過(guò)70%。
如果英偉達(dá)不被限制,原本這些收入都是英偉達(dá)的,現(xiàn)在英偉達(dá)只能看著華為賺的盆滿(mǎn)缽滿(mǎn),只能空著急了。
英偉達(dá)算力霸權(quán)坍塌背后,中國(guó)在芯片與人工智能領(lǐng)域正在走一條新路
英偉達(dá)更大的利空還在于,不僅是國(guó)內(nèi),未來(lái)全球也將大大減少對(duì)英偉達(dá)高端芯片的需求,華為騰等國(guó)產(chǎn)芯片變得更加具備性?xún)r(jià)比。尤其是騰910B芯片性能和A100差不多,價(jià)格還便宜20%以上,大家自然選它。微軟Azure已悄悄采購(gòu)了2萬(wàn)塊騰芯片,亞馬遜AWS開(kāi)始測(cè)試平頭哥的含光800。
加上現(xiàn)在國(guó)內(nèi)算力基建正在走入平穩(wěn),頭部企業(yè)服務(wù)器采購(gòu)量降了40%,對(duì)顯卡需求也少了。中小AI企業(yè)轉(zhuǎn)用云計(jì)算,自建算力中心熱情沒(méi)了,顯卡需求跟著降。英偉達(dá)的苦日子還在后頭。
人工智能,這是美國(guó)當(dāng)下維持科技霸權(quán)的核心護(hù)城河之一,他們正在舉全國(guó)之力拉伸和幫扶英偉達(dá)!在美國(guó)的持續(xù)拉伸和努力下,英偉達(dá)的股票正在拉升,還是有可能再回高峰,但是算力霸權(quán)坍塌的跡象已經(jīng)開(kāi)始了。
可以說(shuō)DeepSeek為華為芯片的高端研制創(chuàng)造了時(shí)間和空間,從趨勢(shì)看,華為這兩年蠶食英偉達(dá)的市場(chǎng)份額的速度會(huì)加快,英偉達(dá)在中國(guó)市場(chǎng)份額很可能在一年內(nèi)跌破40%。
在芯片領(lǐng)域,DeepSeek 與 LPU 的結(jié)合標(biāo)志著 AI 算力領(lǐng)域的重要變革,而 LPU,作為專(zhuān)為語(yǔ)言處理任務(wù)量身定制的硬件處理器,以其區(qū)別于傳統(tǒng) GPU 的創(chuàng)新架構(gòu)、令人驚嘆的性能表現(xiàn)和超低的成本優(yōu)勢(shì),成為了 AI 領(lǐng)域的新寵。
deepSeek與 LPU結(jié)合打掉英偉達(dá)的算力霸權(quán)可能還只是開(kāi)胃菜,當(dāng)美國(guó)死守硅基芯片時(shí),中國(guó)已押注光子芯片和量子計(jì)算。2025年初,清華大學(xué)團(tuán)隊(duì)實(shí)現(xiàn)光子芯片算力提升1000倍,而合肥量子實(shí)驗(yàn)室的“九章三號(hào)”原型機(jī),僅需1毫秒就能完成超級(jí)計(jì)算機(jī)1萬(wàn)年的運(yùn)算量。
前段時(shí)間,浙江大學(xué)發(fā)布了其研發(fā)團(tuán)隊(duì)攻克了超導(dǎo)量子芯片核心技術(shù)的消息,浙大這個(gè)突破直接把我國(guó)量子計(jì)算研發(fā)進(jìn)度往前推。而上海中微電子此前剛剛發(fā)布了其在28納米蝕刻機(jī)獨(dú)特技術(shù)專(zhuān)利,加上deepseek在LPU領(lǐng)域的變革,就會(huì)發(fā)現(xiàn),在芯片與人工智能領(lǐng)域,中國(guó)很可能正在走出另外一條完全不同于歐美的路線(xiàn)。如果是這樣,美國(guó)對(duì)中國(guó)的科技的圍堵就毫無(wú)意義了,因?yàn)樾碌募夹g(shù)路線(xiàn)意味著將建立新的技術(shù)標(biāo)準(zhǔn)與產(chǎn)業(yè)標(biāo)準(zhǔn),在此基礎(chǔ)上建立一個(gè)新的產(chǎn)業(yè)鏈,這個(gè)時(shí)間點(diǎn)或許不遠(yuǎn)了,我們拭目以待。
作者:王新喜 TMT資深評(píng)論人 本文未經(jīng)許可謝絕轉(zhuǎn)載