11月28-29日,為期兩日的36氪WISE2024 商業(yè)之王大會(huì)于北京隆重召開(kāi),作為中國(guó)商業(yè)領(lǐng)域的全明星盛典,WISE大會(huì)今年已經(jīng)是第十二屆,在不斷變化的時(shí)代里見(jiàn)證著中國(guó)商業(yè)的韌性與潛力。
2024,是有些模糊且變化多于穩(wěn)定的一年。相比過(guò)去十年,大家的腳步正放緩,發(fā)展更加理性。2024,也是尋求新的經(jīng)濟(jì)動(dòng)力的一年,新的產(chǎn)業(yè)變化對(duì)每個(gè)主體的適應(yīng)性提出了更高的要求。今年WISE大會(huì)以Hard But Right Thing(正確的事)為主題,在2024,什么是正確的事,成為我們更想交流的話題。
北電數(shù)智CMO、戰(zhàn)略與市場(chǎng)負(fù)責(zé)人楊震
當(dāng)日,北電數(shù)智CMO、戰(zhàn)略與市場(chǎng)負(fù)責(zé)人楊震作了主題為《“國(guó)產(chǎn)算力PoC平臺(tái)”,以場(chǎng)景測(cè)評(píng)尋找算力最優(yōu)解》的演講。
什么是“正確的事”,在如今的AI行業(yè),拆解這樣一個(gè)問(wèn)題變得尤為復(fù)雜。但從2023年人工智能產(chǎn)業(yè)的營(yíng)收角度來(lái)看,人工智能真正進(jìn)入實(shí)際生活還很遠(yuǎn)。芯片層占了產(chǎn)業(yè)90%的營(yíng)收,模型層有7%,但應(yīng)用和工具層僅占了3%。
人工智能真正實(shí)現(xiàn)落地面臨三個(gè)問(wèn)題。算力是要解決的第一個(gè)難題,行業(yè)企業(yè)對(duì)國(guó)產(chǎn)算力芯片的性能和適用場(chǎng)景并不了解,下意識(shí)也會(huì)排斥使用國(guó)產(chǎn)芯片。如何把國(guó)產(chǎn)算力用好是關(guān)鍵的事。第二個(gè)問(wèn)題,是如何打通算力和場(chǎng)景,讓國(guó)產(chǎn)芯片和模型能完成適配,更好發(fā)揮模型的效果。第三個(gè)問(wèn)題,則是如何讓國(guó)產(chǎn)芯片協(xié)同作戰(zhàn),發(fā)揮集群效應(yīng),發(fā)揮不同國(guó)產(chǎn)芯片的算力優(yōu)勢(shì)。
北電數(shù)智推出了全國(guó)首個(gè)國(guó)產(chǎn)算力PoC平臺(tái),打破國(guó)產(chǎn)算力供給側(cè)與需求側(cè)之間的產(chǎn)業(yè)鏈斷層,國(guó)產(chǎn)算力集群提供垂類(lèi)場(chǎng)景評(píng)測(cè)、適配與驗(yàn)證服務(wù),同時(shí),為AIGC視聽(tīng)、金融、政務(wù)、工業(yè)、醫(yī)療、具身智能、交通等多領(lǐng)域AI應(yīng)用企業(yè)提供多種算力適配試驗(yàn)空間,推動(dòng)國(guó)產(chǎn)算力芯片和場(chǎng)景適配,將國(guó)產(chǎn)芯片用起來(lái),推動(dòng)人工智能時(shí)代的到來(lái)。
以下為北電數(shù)智CMO、戰(zhàn)略與市場(chǎng)負(fù)責(zé)人楊震的演講實(shí)錄:
楊震:今天相信每家企業(yè)都是被這個(gè)題目引來(lái)的做難而正確的事。人工智能是當(dāng)下最火的話題,如何把算力用起來(lái)是難而正確的事。這非常契合今天的題,它怎么難、如何難。
通用技術(shù)變革生產(chǎn)力,難而漫長(zhǎng)的事情
人工智能是一個(gè)全新通用技術(shù)的發(fā)明,人類(lèi)歷史上每次出現(xiàn)的新通用技術(shù)都帶來(lái)了產(chǎn)業(yè)變革、行業(yè)變革和每個(gè)人生活的變革,它不斷推動(dòng)人類(lèi)文明一點(diǎn)點(diǎn)往前。前三次工業(yè)革命都不如人工智能革命帶來(lái)的變化徹底,它應(yīng)該是整個(gè)人類(lèi)文明一次質(zhì)的飛躍。
但是這個(gè)飛躍來(lái)得容易嗎?非常難。以電舉例,電發(fā)明之前是蒸汽動(dòng)力,那個(gè)時(shí)代已經(jīng)有工廠,所有工廠都用蒸汽動(dòng)力驅(qū)動(dòng);從電和發(fā)電機(jī)被發(fā)明出來(lái),到電真正進(jìn)入工廠替代動(dòng)力源將所有工廠變成電力工廠花了50年,可想而知有多難。它不僅是動(dòng)力源的替換,還要替換新型生產(chǎn)工具、產(chǎn)線、完整的生產(chǎn)系統(tǒng),不僅是技術(shù),更是流程、組織、系統(tǒng),和每個(gè)人意識(shí)形態(tài)的變化。
今年持續(xù)有AI手機(jī)、AIPC推出。個(gè)人電腦誕生于上個(gè)世紀(jì)七八十年代,但個(gè)人電腦完全進(jìn)入企業(yè)是新世紀(jì)以后的事,直到ERP、CRM等一系列工具能發(fā)揮電腦的作用,給企業(yè)帶來(lái)質(zhì)的變化時(shí),它才會(huì)被普及。
回到人工智能,人工智能上個(gè)世紀(jì)50年代就出現(xiàn)了,但直到2006年深度學(xué)習(xí)提出才被大家關(guān)注。50年代就有類(lèi)似決策向量等理論,當(dāng)時(shí)《紐約時(shí)報(bào)》也預(yù)測(cè)說(shuō)人工智能將來(lái)臨,機(jī)器幫人做事在十年之內(nèi)可實(shí)現(xiàn),結(jié)果花了50年才成真。到新世紀(jì)時(shí)才會(huì)有機(jī)器學(xué)習(xí)出現(xiàn),到了2021年神經(jīng)網(wǎng)絡(luò)這個(gè)體系在大賽上取得勝利,神經(jīng)網(wǎng)絡(luò)這個(gè)詞才終于被大家所認(rèn)知。同樣的道理,大家真正認(rèn)識(shí)到生成式人工智能是GPT3.5涌現(xiàn)了所謂的智能,給大家?guī)?lái)了全新的認(rèn)知。之前雖然說(shuō)有深藍(lán)下國(guó)際象棋,AlphaGo下圍棋等,但大家并沒(méi)有切身體會(huì)到它真正產(chǎn)生了智能的狀況。
人工智能落地,需要敢用、會(huì)用、用好國(guó)產(chǎn)算力
這時(shí)候又一個(gè)問(wèn)題出來(lái)了,人工智能是一項(xiàng)通用技術(shù),它距離真正進(jìn)入千行百業(yè)、影響每個(gè)人的生活還有多遠(yuǎn),從營(yíng)收數(shù)據(jù)就可以看到。人工智能三大要素算力、算法、數(shù)據(jù),目前還是賣(mài)鏟子的人賺錢(qián),2023年芯片層占了整個(gè)人工智能產(chǎn)業(yè)90%的收入,模型層貢獻(xiàn)了7%的收入,應(yīng)用和工具層僅占了3%,從這個(gè)數(shù)據(jù)看,離人工智能實(shí)打?qū)嵚涞剿腥松钸很遠(yuǎn)。
為什么這么遠(yuǎn)?絕大部分通用技術(shù)在進(jìn)到產(chǎn)業(yè)、社會(huì)前,首先會(huì)在To B端突破。大家可能已經(jīng)開(kāi)始用機(jī)器人寫(xiě)文章、查東西,但人工智能如果想進(jìn)入企業(yè),僅有聊天機(jī)器人是不夠的,他需要系統(tǒng)搭建。
對(duì)于企業(yè)尤其是中國(guó)企業(yè)來(lái)說(shuō),要搭這個(gè)系統(tǒng)很不容易。算力其實(shí)是要解決的第一個(gè)難題。國(guó)內(nèi)有將近30家GPU廠商,國(guó)產(chǎn)智算芯片有多好,能支持什么場(chǎng)景,怎么能夠用起來(lái),很多人不知道,所以下意識(shí)也會(huì)排斥不知道的東西,還是想用進(jìn)口芯片。如何用,如何把國(guó)產(chǎn)算力用好,其實(shí)是蠻關(guān)鍵的一件事情。同時(shí)由于我國(guó)的產(chǎn)業(yè)結(jié)構(gòu),會(huì)看到有芯片層有30多家企業(yè),模型層有百模大戰(zhàn),整個(gè)人工智能產(chǎn)業(yè)鏈在國(guó)內(nèi)還是相對(duì)離散的狀況,并沒(méi)有進(jìn)入收斂期,就讓構(gòu)筑這個(gè)系統(tǒng)更復(fù)雜,企業(yè)更難抉擇用誰(shuí)家的芯片、誰(shuí)家的模型,怎么搭智能體平臺(tái),構(gòu)筑企業(yè)級(jí)應(yīng)用和企業(yè)級(jí)工作流,是所有人思考的事情。
打通算力和場(chǎng)景,PoC平臺(tái)加速人工智能時(shí)代到來(lái)
今天講的是國(guó)產(chǎn)算力的PoC平臺(tái),第二個(gè)問(wèn)題,為什么需要國(guó)產(chǎn)算力PoC平臺(tái)?總書(shū)記常說(shuō),看清現(xiàn)實(shí),認(rèn)清差距,找到路徑,解決問(wèn)題,整個(gè)國(guó)產(chǎn)算力和國(guó)際上先進(jìn)的算力是存在兩代左右代差的,但國(guó)產(chǎn)算力整體來(lái)說(shuō)并不是不能用,他們都有自己發(fā)揮得非常好的部分,但使用者其實(shí)不知道國(guó)產(chǎn)算力哪里好用,怎么用起來(lái)。
基于這樣的狀況,對(duì)于算力供給方,當(dāng)沒(méi)有人給它場(chǎng)景的時(shí)候,它其實(shí)缺一個(gè)練兵場(chǎng),能提供的都是單芯片的理論數(shù)據(jù),但集群數(shù)據(jù)是怎么樣的,很難得到。
整體來(lái)說(shuō),國(guó)產(chǎn)芯片產(chǎn)能還是受限的,單一國(guó)產(chǎn)芯片整體產(chǎn)量不足,很難滿足需求。算力使用方也經(jīng)常跟我們說(shuō),想用國(guó)產(chǎn)算力,但不夠。他們其實(shí)有場(chǎng)景、有模型,但是模型任務(wù)一直在排隊(duì),等,這是我們要面對(duì)的實(shí)際問(wèn)題。
這時(shí)候就提到第三個(gè)問(wèn)題,為什么國(guó)產(chǎn)芯片不能協(xié)同作戰(zhàn)?可能大家也聽(tīng)說(shuō)過(guò),每個(gè)芯片都有自己的生態(tài),這個(gè)生態(tài)形成了自己的商業(yè)閉環(huán),但是不同的生態(tài)之間協(xié)同作戰(zhàn)存在一個(gè)隔閡,換句話說(shuō),在非常多的智算中心里,哪怕在同一個(gè)智算中心里有不同的集群,每個(gè)都是不同的算力煙囪,很難協(xié)同作戰(zhàn)。對(duì)于使用方來(lái)說(shuō)不知道誰(shuí)家好,買(mǎi)單一芯片總量又不夠,這又是個(gè)非常大的問(wèn)題。
這次PoC平臺(tái),我們推了非常多的場(chǎng)景,比如金融、工業(yè)制造、AIGC視聽(tīng)場(chǎng)景,在這個(gè)場(chǎng)景里大家可以把自己的場(chǎng)景放進(jìn)去看一下,國(guó)產(chǎn)算力在相應(yīng)場(chǎng)景里表現(xiàn)怎么樣,好不好用,適不適用,我們希望通過(guò)這樣的平臺(tái),讓大家正確地認(rèn)知國(guó)產(chǎn)算力,正確地認(rèn)知國(guó)產(chǎn)的算力集群是否能有效支撐實(shí)際的場(chǎng)景使用。
想讓國(guó)產(chǎn)芯片協(xié)同作戰(zhàn),有蠻多的難而正確的事,或者說(shuō)蠻多的苦工夫要做。芯片和模型之間實(shí)現(xiàn)適配要磨合,能夠支撐芯片和模型有最好的表現(xiàn),這是單一模型;煸菏前巡煌懔捍蛏ⅲ屗麄冃纬删薮蟮奶摂M算力池,對(duì)外根據(jù)實(shí)際場(chǎng)景提供相應(yīng)的算力支持和服務(wù)。他就有非常多事情要做。第一,要讓納管的不同算力集群能夠無(wú)差別支持不同的模型,有蠻多的事情要做。
我們已經(jīng)實(shí)現(xiàn)超過(guò)10種國(guó)產(chǎn)芯片算力集群向上交叉普適的適配,超過(guò)20種主流的基座大模型的適配。為了支撐主流基座大模型,我們先做了算子補(bǔ)齊和自動(dòng)調(diào)優(yōu),讓所有主流芯片和基座模型進(jìn)行交叉適配。如果兩個(gè)芯片集群協(xié)同,打一些補(bǔ)丁就好了,但要想實(shí)現(xiàn)納管的所有算力集群協(xié)同作戰(zhàn)、共同對(duì)外,打補(bǔ)丁這條路是走不通。我們寫(xiě)了統(tǒng)一的通信庫(kù),讓不同的算力集群用我們的通信庫(kù)來(lái)進(jìn)行通信。
剛才提到有一些國(guó)產(chǎn)算力和進(jìn)口算力存在代差,我們?nèi)パ芯克惴ㄓ袥](méi)有機(jī)會(huì)定義硬件,給國(guó)產(chǎn)芯片加速,我們做了非常多類(lèi)似時(shí)間壓縮、編譯優(yōu)化的事情,通過(guò)軟件給硬件做加速。
因?yàn)槲覀兪蔷薮筇摂M的算力池,對(duì)外提供算力服務(wù)其實(shí)需要強(qiáng)大、靈敏的調(diào)度策略,我們做了多套靈敏的調(diào)度策略,根據(jù)不同任務(wù)有效、準(zhǔn)確的調(diào)配整個(gè)算力池里不同的算力,以支撐各類(lèi)任務(wù)。我們還在攻關(guān)調(diào)度,讓算力像電力一樣可以削峰填谷,實(shí)現(xiàn)不同集群協(xié)同作戰(zhàn),無(wú)差別提供服務(wù)。
以往提供服務(wù)都是租賃的方式,按臺(tái)、匹來(lái)租賃。當(dāng)我們做到這樣的技術(shù),其實(shí)可以按消耗,按吞吐量計(jì)費(fèi),你用了算力才收費(fèi),不用的時(shí)候不會(huì)因?yàn)槟阏加脮r(shí)長(zhǎng)而收錢(qián),讓非常多中小公司、開(kāi)發(fā)群體,甚或是個(gè)人開(kāi)發(fā)者,能用得起算力,用到非常好的高質(zhì)量算力。
在基礎(chǔ)工作做完以后,為政務(wù)、醫(yī)療等場(chǎng)景提供有效支撐。提到這個(gè)的時(shí)候又會(huì)提到非常多難的部分,其實(shí)做整個(gè)算力測(cè)評(píng)適配的時(shí)候,一定要對(duì)背后的原子級(jí)場(chǎng)景區(qū)分,語(yǔ)音識(shí)別、圖象識(shí)別、糾錯(cuò)等,才能調(diào)用每個(gè)芯片里相應(yīng)的參數(shù)和指標(biāo)。
我們國(guó)產(chǎn)的PoC平臺(tái)已經(jīng)落地北京數(shù)字經(jīng)濟(jì)算力中心,對(duì)外提供服務(wù)。上周新華社、人民日?qǐng)?bào)等都做了報(bào)道。我們希望搭建一個(gè)使用方和國(guó)產(chǎn)算力方雙向奔赴的平臺(tái),推動(dòng)國(guó)產(chǎn)算力能夠被當(dāng)做電一樣用起來(lái),推動(dòng)整個(gè)人工智能時(shí)代的加速落地。
快速介紹一下我們是誰(shuí),我們是北京電控旗下的企業(yè),去年8月1號(hào)才成立,現(xiàn)在第16個(gè)月。由于年輕決定了我們是一家人工智能的國(guó)企,我們也以總書(shū)記對(duì)科技企業(yè)三性,原創(chuàng)性、顛覆性、引領(lǐng)性作為對(duì)自身的要求。新中國(guó)成立的時(shí)候,酒仙橋一度是新中國(guó)電子工業(yè)的搖籃,北京市數(shù)字經(jīng)濟(jì)算力中心以及國(guó)產(chǎn)PoC平臺(tái)就在離這里大概一公里的地方,我們也希望酒仙橋能夠在人工智能時(shí)代成為新的人工智能高地,推動(dòng)人工智能第四次工業(yè)革命在中國(guó)加速落地。