夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI
DeepSeek的含金量還在上升,一個(gè)半個(gè)周末過去發(fā)生這些大事:
國(guó)家超算互聯(lián)網(wǎng)平臺(tái)上線DeepSeek-R1,最高支持671B的滿血版。
平頭哥玄鐵芯片成功適配DeepSeek-R1系列蒸餾模型,在RISC-V架構(gòu)CPU和端側(cè)平臺(tái)打開新的應(yīng)用空間。
再加上春節(jié)期間的三大運(yùn)營(yíng)商全面接入DeepSeek等消息,它的影響力已不僅限于AI和互聯(lián)網(wǎng),正在往產(chǎn)業(yè)更深層進(jìn)發(fā)。
總之,對(duì)于用戶和開發(fā)者來說不用再看“服務(wù)器繁忙”的臉色,可以多換幾個(gè)地方再試了。
隨著官方服務(wù)器不堪重負(fù),以及DeepSeek-V3 API優(yōu)惠結(jié)束恢復(fù)原價(jià),各大云服務(wù)商也抓住機(jī)會(huì)卷了起來。
云服務(wù)卷價(jià)格,新式芯片卷速度騰訊云率先上線支持聯(lián)網(wǎng)搜索的DeepSeek,結(jié)合自家旗下搜狗搜索提供搜索增強(qiáng)API。
同時(shí)支持集成私域知識(shí)庫(kù),一鍵整合RAG。
商湯和阿里直接卷起了價(jià)格。
商湯大裝置平臺(tái)上3個(gè)月內(nèi)可限時(shí)免費(fèi)使用1000萬tokens,同時(shí)支持128K最大上下文長(zhǎng)度限制。
阿里云為新用戶提供100萬免費(fèi)tokens,同時(shí)蒸餾版模型價(jià)格也比較低。
與此同時(shí),各類芯片正在輸出速度上展開激烈競(jìng)爭(zhēng)。
通用GPU方面,AMD員工透露MI300X上的DeepSeek-R1滿血版速度比剛發(fā)布時(shí)已經(jīng)快了3倍,并發(fā)布官方Docker Image鏡像。
在英偉達(dá)與CUDA生態(tài)之外,提供AMD與ROCm的另一種選擇。
三大新型AI推理芯片Groq、Cerebras、Sambanova已經(jīng)把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。
快到你都看不清發(fā)生了什么,推理思維鏈完成了、代碼寫完了,一眨眼直接運(yùn)行了。
△groq芯片運(yùn)行DeepSeek-R1-Distill Llama-70B
One More Thing還有一條有意思的消息,ai.com域名現(xiàn)在已定向到DeepSeek官網(wǎng)。
甚至有傳言稱是DeepSeek重金拿下了該域名。
不過一直關(guān)注大模型的朋友可能還記得,這個(gè)域名曾先后定位到ChatGPT和xAI。
大概率是域名所有人個(gè)人行為~
國(guó)家超算互聯(lián)網(wǎng)平臺(tái)https://www.scnet.cn/騰訊云DeepSeek專題https://cloud.tencent.com/developer/special/deepseek阿里云DeepSeek解決方案https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms商湯大裝置https://www.sensecore.cn
參考鏈接:[1]https://x.com/AnushElangovan/status/1888006978959741390[2]https://x.com/Dev__Digest/status/1887337604267332022