明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
創(chuàng)立10年內估值超過10億美元的創(chuàng)新公司,被稱之為獨角獸,它們是市場潛力無限的績優(yōu)股,是為行業(yè)帶來技術創(chuàng)新、模式創(chuàng)新的佼佼者。
大模型時代中,類似的新價值紅線也正在形成
日均10億Tokens消耗量,AI業(yè)務跑通的基本標準。
量子位結合2024下半年市場數(shù)據(jù)盤點,達到這一紅線的中國企業(yè),至少200家,覆蓋企服、陪伴、教育、互聯(lián)網(wǎng)、游戲、終端等領域。
這意味著,大模型時代的“搶風口”大戰(zhàn)告一段落,真正具備價值參考的商業(yè)模式開始明確。
各個垂直領域的先行者能夠找到場景,做到單日至少消耗10億Tokens,就是最直接的證明。
不過問題是,日均10億Tokens基準線,why?
看日活、看單用戶Tokens消耗首先來計算下,日均10億Tokens消耗量是什么概念?
參考DeepSeek API文檔中給出的標準:
1 個英文字符 ≈ 0.3 個 Token。
1 個中文字符 ≈ 0.6 個 Token。
在中文世界里,10億Tokens約代表16億+漢字。換算成對話量,一本《紅樓夢》的字數(shù)在70-80萬左右,相當于一天和AI聊了2000本《紅樓夢》的內容。
按照一個生成式AI模型單次響應平均需要處理1000個Tokens估算,10億Tokens意味著一天將完成100萬次響應。
如果是To C應用,100萬次響應背后,至多將是100萬DAU。
以作業(yè)幫為例,僅推算其旗下出海產品Question.AI的數(shù)據(jù),單日消耗Tokens就接近10億規(guī)模。
這款AI教育App以大模型為基礎,它支持拍圖搜題、智能助教等功能,能以Chatbot的形式講解回答問題。
根據(jù)作業(yè)題目以及實際場景問答預估,一輪對話Tokens消耗量500,單人單日平均對話至少3輪。已披露數(shù)據(jù)顯示,Question.AI的DAU將近60w。
由此推算,僅Question.AI的單日Tokens消耗量已接近10億規(guī)模。與此同時,作業(yè)幫還布局多款AI應用,并推出了多款AI學習機,每日Tokens消耗總量只會更多。
再來看AI陪聊賽道的筑夢島。
根據(jù)最新披露消息,筑夢島累計創(chuàng)作者數(shù)量超50萬人,Top20人物中以原創(chuàng)人物為主,占比85%。筑夢島用戶平均單用戶單日輸入字數(shù)可達4000字以上,人均日對話輪次超120輪。
單用戶單日平均獲得的AI輸出,按照輸入的2-3倍計算,大約在8000-12000字(AI輸出包括AI虛擬人對話回復、AI生成提示回答等)。
量子位智庫數(shù)據(jù)顯示,筑夢島DAU目前在10萬水平。由此可以推算,筑夢島單日Tokens消耗量超過10億規(guī)模。
如果來到終端場景,Tokens的消耗方式則變得更加多元。
AI手機中除了智能助手,還有各種滲透在系統(tǒng)里的AI功能,比如一鍵路人消除、通話總結、一鍵識屏等。據(jù)OPPO 2024年10月數(shù)據(jù),小布助手月活突破1.5億。
更進一步,云廠商披露的Tokens調用量以及合作客戶情況也為這一基準提供參考。
2024年7月,騰訊混元披露單日調用量達千億Tokens(包含自身業(yè)務)。
2024年8月,百度披露文心大模型日均調用量超6億次,日均處理Tokens文本超1萬億;截止11月初文心大模型的日均調用量超過 15 億次。一年前這個數(shù)據(jù)是5000萬次,一年增長了30倍。
2024年7月,豆包大模型平均每家企業(yè)客戶日均Tokens使用量增長了22倍。12月字節(jié)最新透露,豆包通用模型日均Tokens使用量超過4萬億。
如此消耗,來自于誰?
參考火山引擎官網(wǎng)披露的客戶名單,來自汽車、金融、互聯(lián)網(wǎng)、消費零售、智能終端、游戲、醫(yī)療健康賽道的頭部廠商們都很突出,也都是大家耳熟能詳?shù)钠放啤?br/>
與此同時,這群“10億Tokens俱樂部成員”在2024年過得如何,也為這一價值紅線提供了有力參考。
AI業(yè)務成為拉動增長的關鍵貢獻首先來在海外異軍突起的作業(yè)幫。
2023年9月,作業(yè)幫推出融合多年教育數(shù)據(jù)和AI算法積累的銀河大模型。它專門為教育領域打造,覆蓋多學科、多學段、多場景。
據(jù)Sensor Tower監(jiān)測2024上半年數(shù)據(jù),其旗下出海產Question.AI殺入美國AI類應用下載量前三,并拿下百萬MAU。另一款對話型AI產品Poly.AI同樣進入下載的前三十名。
另一邊,在更能帶來直接營收的AI學習機方面。
2024年7月,沙利文調研認證作業(yè)幫在上半年拿下中國全網(wǎng)學習機銷量第一。洛圖科技數(shù)據(jù)顯示,2024年第三季度,作業(yè)幫學習機產品以20.6%的市場份額位居線上市場銷量榜首。
企業(yè)服務領域,金山云在2024年第一季度財報中明確表示,該季度總收入環(huán)比穩(wěn)定增加3.1%,主要來自于AI相關客戶。
公有云收入11.87億元,較上季度增長12.9%,主要由AI客戶貢獻。在主動縮減CDN服務規(guī)模的情況下,這部分增長拉動整體公有云收入,較2023年同季度增加2.9%。
這種趨勢在第二季度、第三季度延續(xù),AI客戶依舊貢獻了公有云業(yè)務以及整體收入的主要增長。
再來看離大家日常生活最近的AI手機。
在大模型趨勢開啟后,OPPO旗幟鮮明擁抱浪潮,將生成式AI功能引入ColorOS以及全產品系列,2024年讓將近5000萬OPPO用戶的手機搭載GenAI功能。
Counterpoint數(shù)據(jù)顯示,2024年全球前四大(市場占有率)智能手機廠商分別為三星、蘋果、小米、OPPO。
而根據(jù)Canalys的數(shù)據(jù),2024年,全球16%的智能手機出貨量為AI手機。預測顯示,到2028年這一比例將激增至54%。2023年至2028年間,AI手機市場預計將以63%的年均復合增長率(CAGR)增長。這一轉變將首先在高端機型上出現(xiàn)。
比如OPPO最新發(fā)布的Find X8系列,AI味就更加濃厚。通過引入豆包通用模型Pro、豆包通用模型Lite、豆包·角色扮演模型以及更強的大模型實時聯(lián)網(wǎng)檢索能力,OPPO Find X8系列可以提供更加細致的AI服務體驗。
這種趨勢反映到云計算領域,則是更大規(guī)模的Tokens消耗量。
火山引擎譚待曾在采訪中表示:
五年后,企業(yè)用到的日均Tokens可能達到幾百萬億,尤其在多模態(tài)大模型推出后,各場景內都會有Agent助理跟隨,帶來很大的消耗量。
得出如此數(shù)據(jù)預估背后,是對算力基礎設施、Agent發(fā)展、AI應用開發(fā)以及整體大模型落地變化的細微洞察。
Agent+AI Infra,百萬億Tokens消耗不是夢先從應用落地角度來看,Agent趨勢愈加明顯,AI原生應用開始發(fā)力。
OpenAI CEO奧特曼的年終盤點中提到:
我們相信,在 2025 年,我們可能會看到第一批人工智能代理 “加入勞動力大軍”,并實質性地改變公司的產出。
緊接著,OpenAI身體力行,上線Agent能力,ChatGPT開始有了執(zhí)行力,可以替人完成各種任務。
更落地層面,量子位智庫觀測到AI原生應用開始發(fā)力。
伴隨著底層模型能力不斷升級,AI智能助手APP在過去一年中增長明顯。
2024年,AI智能助手APP端的新增用戶規(guī)模就超過3.5億。12月的單月新增用戶超過5000萬,相較于2024年初實現(xiàn)了近200倍的增長。
以豆包為例。豆包在9月成為國內用戶規(guī)模破億的首個AI應用后,目前以超50%的市場份額坐實“國民級AI原生應用”和“AI智能助手APP No.1”。
就在今天,豆包大模型1.5 Pro最新上線,能力全面提升。通過MoE架構優(yōu)化,用1/7參數(shù)量就超過了稠密模型性能。
多模態(tài)能力上,視覺能力支持動態(tài)分辨率、可處理百萬級分辨率圖片,在多個基準測試中表現(xiàn)優(yōu)異;語音方面創(chuàng)新提出Speech2Speech端到端框架,實現(xiàn)語音和文本模態(tài)深度融合,提升語音對話的理解力和表現(xiàn)力。
同時還通過RL方法大幅提升模型推理能力,階段性進展Doubao-1.5-Pro-AS1-Preview在AIME上已經(jīng)超過o1-preview、o1等推理模型。
更強大的底層模型無疑為AI原生應用提供了更堅實底座。
聚焦到企業(yè)側,切實的增長發(fā)生的更早。Agent開發(fā)平臺成為云廠商增長最快的企服產品之一。
比如火山引擎推出的HiAgent,上線7個月已經(jīng)簽下100+客戶。
它的定位是企業(yè)專屬的AI應用創(chuàng)新平臺,目的是幫助企業(yè)能夠用零代碼或低代碼的方式走完從模型到應用的“最后十公里”。
HiAgent可以向下兼容多種模型,原生整合豆包大模型的同時還兼容第三方的閉源或開源模型,并通過提示詞工程、知識庫、插件、工作流編排四要素來輔助輕松構建智能體,預置豐富的模板和插件,并給予自定義的自由空間。
目前HiAgent已經(jīng)為中國飛鶴、美宜佳、華泰證券等500強企業(yè)提供服務,落地場景200+,打造Agent 500+款。
扣子AI原生應用開發(fā)服務平臺也助力蘇泊爾、招商銀行、和府撈面、中和農信等打造企業(yè)級Agent開發(fā)上線。
相較于HiAgent,它面向AI應用開發(fā)人員不足、服務穩(wěn)定性要求高的企業(yè),降低大模型應用開發(fā)門檻。扣子作為AI應用開發(fā)平臺,提供鏈接插件、工作流、圖像流、知識庫、數(shù)據(jù)庫等一系列工具,同樣無縫銜接豆包大模型家族以及企業(yè)精調模型與開源模型,為企業(yè)用戶提供豐富應用模板,以及調測、發(fā)布、集成、觀測的全周期服務。比如使用新聞插件,就能快速打造上線一個播報最新時事新聞的AI播音員。
透過這些實際落地進展不難發(fā)現(xiàn),當AI應用/Agent開發(fā)門檻大幅降低,各行各業(yè)進入到了規(guī);剿鏖_發(fā)階段,頭部企業(yè)的腳步更快,更早利用大模型變革自身業(yè)務,也更先解鎖大模型紅利。
隨著行業(yè)先鋒案例陸續(xù)出現(xiàn),未來AI應用落地規(guī)模還會更進一步鋪開。與此同時,如HiAgent這類平臺也會不斷進化,其能力將不局限于智能體開發(fā),而是更進一步發(fā)展成為AI能力中臺。
再來看供給方面,2024年云計算領域最顯化的現(xiàn)象是“價格戰(zhàn)”。在這背后其實是算力成本還在進一步優(yōu)化,云廠商可以繼續(xù)“以價換量”,推動AI應用落地趨勢。
行業(yè)公認,未來的計算范式應該以GPU為核心。
2024年,云廠商紛紛持續(xù)加強AI Infra能力,以應對正在爆發(fā)的大規(guī)模推理需求。
比如火山引擎推出了AI云原生方案。它支持大規(guī)模GPU集群彈性調度管理、計算產品和網(wǎng)絡優(yōu)化都專為AI推理設計。在過去一年多的大模型應用落地戰(zhàn)中,火山引擎為美圖秀秀、沐瞳科技、深勢科技等提供了堅實的計算底座。
前不久,火山引擎Force冬季大會上還進一步升級了以GPU為中心的AI Infra分布式業(yè)務系統(tǒng),通過vRDMA網(wǎng)絡支持大規(guī)模并行計算及P/D分離推理架構,提升訓練和推理效率,降低企業(yè)使用成本;EIC彈性極速緩存解決方案,實現(xiàn)GPU直連,使大模型推理時延降低至五十分之一,成本降低20%。
在技術門檻/模型價格不斷降低、算力成本不斷優(yōu)化各種趨勢交織下,日均百萬億Tokens的消耗不是隨便說說,而是幾乎觸手可及的現(xiàn)實。
由此,單個企業(yè)日均10億Tokens消耗成為一條非常有價值的參考線。
第一,它代表大模型應用落地新趨勢,企業(yè)擁抱大模型紅利,要朝著這一數(shù)字前進;
第二,它成為大模型應用落地新階段的門檻,AI業(yè)務真正跑通了嗎?需求真實存在嗎?都可以此為參考系找回答。
第三,日均10億Tokens消耗也只是大模型落地“入門級水準”,單客戶百萬億、千萬億Tokens消耗是更值得期待的星辰大海。
只是隨著這一新價值基準形成,誰能成為大模型落地的“獨角獸”,能更清晰判斷了。
大模型趨勢正在進入全新階段:大規(guī)模商用落地。
生產力釋放背后,商業(yè)機會不斷涌現(xiàn)。我們希望通過這一系列欄目提供一種視角,分析大模型應用落地早期階段浮現(xiàn)出的種種規(guī)律變化,從技術維度把握創(chuàng)新浪潮背后的演化路線。
以上是量子位最新原創(chuàng)系列策劃欄目「模力熵增」第三期。