近來(lái),中國(guó)人工智能(AI)公司深度求索(DeepSeek)發(fā)布的開(kāi)源大模型DeepSeek-R1火遍全球,引發(fā)業(yè)內(nèi)熱議:全民AI時(shí)代是否已經(jīng)到來(lái)?
過(guò)去兩年多,以O(shè)penAI為代表的美國(guó)公司開(kāi)啟并引領(lǐng)了人工智能大模型投資熱潮,因?yàn)椴蝗毙酒退懔,其主流思路是“越大越好”以更?qiáng)算力、更多數(shù)據(jù)訓(xùn)練更大的模型,來(lái)獲得更高性能。這讓大模型能源消耗巨大,訓(xùn)練成本驚人,也帶來(lái)了商業(yè)推廣難題:大模型投不起,小模型不好用。
DeepSeek改變了這一格局。他們?cè)谀P图軜?gòu)和訓(xùn)練過(guò)程中進(jìn)行深度優(yōu)化,在大幅降低計(jì)算資源消耗的同時(shí),躋身世界頂級(jí)AI大模型之列,實(shí)現(xiàn)了“低成本”與“高性能”的兼得。同時(shí),與OpenAI的閉源策略相反,DeepSeek免費(fèi)開(kāi)源其大模型,明示全部技術(shù)路線(xiàn),更加推動(dòng)了大模型技術(shù)從“奢侈品”向“日用品”的轉(zhuǎn)變。
從技術(shù)進(jìn)步角度看,低成本開(kāi)源大模型開(kāi)啟競(jìng)爭(zhēng)新賽道,AI的未來(lái)更值得期待。
低成本是技術(shù)普及的基本要求,買(mǎi)得起才能讓千家萬(wàn)戶(hù)用得上。小汽車(chē)、個(gè)人電腦、手機(jī)的普及都是如此,人工智能產(chǎn)業(yè)大概也不會(huì)例外。這幾年,企業(yè)界和科技界已經(jīng)為降低大模型成本作出了大量努力,DeepSeek模型正是其中的杰出成果,證明“此路可通”。
但大模型價(jià)格還沒(méi)有降到底。在降本增效這條路上,DeepSeek并非終點(diǎn),而是一個(gè)新的起點(diǎn)。開(kāi)源代碼、開(kāi)放API(應(yīng)用程序編程接口)及訓(xùn)練方法,吸引全球開(kāi)發(fā)者參與技術(shù)迭代。1月20日R1推出后,各國(guó)AI技術(shù)人員掀起“DeepSeek復(fù)現(xiàn)熱潮”。有美國(guó)科研團(tuán)隊(duì)聲稱(chēng),僅用幾十美元成本租用云計(jì)算資源,便復(fù)現(xiàn)了模型。
DeepSeek使用專(zhuān)家混合架構(gòu)MoE實(shí)現(xiàn)了更高的成本效益。而就在2月12日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布推出全新的稀疏模型架構(gòu)UltraMem,優(yōu)化了推理性能,使得推理速度較MoE架構(gòu)提升了2倍至6倍,推理成本最高可降低83%。
從商業(yè)應(yīng)用角度看,DeepSeek重塑AI生態(tài)鏈,大模型展現(xiàn)了巨大商業(yè)潛力。
美國(guó)的AI龍頭公司一方面夸大開(kāi)源AI的安全風(fēng)險(xiǎn),力圖通過(guò)監(jiān)管抑制開(kāi)源AI,另一方面又用巨大投入抬高大模型準(zhǔn)入門(mén)檻。這就形成了“金字塔”生態(tài),科技巨頭壟斷大模型,中小企業(yè)依賴(lài)API。
而開(kāi)源模型對(duì)于全球AI供應(yīng)鏈至關(guān)重要,廣大發(fā)展中國(guó)家尤其需要開(kāi)源AI技術(shù)。開(kāi)源模型讓每個(gè)開(kāi)發(fā)者都能輕松調(diào)用強(qiáng)大的AI工具,不再受大公司的約束,AI的進(jìn)化速度和普及程度都明顯提升。
連日來(lái),上市公司接入DeepSeek模型的公告刷屏,令人驚呼“所有上市公司都在接入DeepSeek”。這體現(xiàn)了市場(chǎng)對(duì)于低成本、高性能開(kāi)源大模型的渴求。當(dāng)各行各業(yè)的開(kāi)發(fā)者在開(kāi)源框架上搭建文本創(chuàng)作、智能客服、醫(yī)學(xué)影像診斷等各類(lèi)應(yīng)用時(shí),新的生態(tài)系統(tǒng)已應(yīng)運(yùn)而生。
當(dāng)然,開(kāi)啟全民AI時(shí)代,還面臨許多挑戰(zhàn)。開(kāi)源模式依賴(lài)社區(qū)貢獻(xiàn),需建立激勵(lì)機(jī)制避免碎片化,也要在開(kāi)源與商業(yè)化之間取得平衡,以利于生態(tài)系統(tǒng)的可持續(xù)發(fā)展。讓AI適配智能眼鏡、手機(jī)等邊緣計(jì)算設(shè)備,要有更好的模型壓縮技術(shù)。通用模型在垂直場(chǎng)景易“水土不服”,需結(jié)合行業(yè)知識(shí)庫(kù)定制化開(kāi)發(fā),要抓緊制定行業(yè)數(shù)據(jù)共享與安全標(biāo)準(zhǔn)。防范算法歧視與就業(yè)沖擊,還要加強(qiáng)AI倫理教育,構(gòu)建“技術(shù)法律社會(huì)”協(xié)同治理框架。
人工智能是引領(lǐng)未來(lái)產(chǎn)業(yè)的科技。我們不僅要做技術(shù)突破者,更要做規(guī)則重構(gòu)者,要讓人工智能大模型從“精英游戲”變成“全民紅利”。(本文來(lái)源:經(jīng)濟(jì)日?qǐng)?bào) 作者:佘惠敏)