在過去兩年的大模型熱戰(zhàn)中,無論是垂直創(chuàng)業(yè)的AI六小龍,還是全押AI的互聯(lián)網(wǎng)大廠,中國的參與者都在不約而同地在尋找大模型商業(yè)邏輯的閉環(huán):
在動輒百億的資本開支面前,大模型作為某種意義上的基礎(chǔ)設(shè)施,其規(guī)模效應(yīng)需要盡早浮現(xiàn),其商業(yè)化路徑需要盡早清晰化。
而在12月18日字節(jié)火山引擎冬季FORCE原動力大會,關(guān)于AI應(yīng)用該如何商業(yè)化的答案,火山引擎給出了非常確定性的答案:
從技術(shù)層面,火山引擎成功的拓展了模型邊界,實現(xiàn)多模態(tài)發(fā)展;而從商業(yè)變現(xiàn)層面,火山引擎則是通過平價,實現(xiàn)了AI普惠。
01 更強的模型,來自火山引擎的視覺智能今天的大模型,或者說,作為服務(wù)的大模型(MaaS),是AI時代的底座。
經(jīng)歷了參數(shù)爆炸,算法堆積,算法優(yōu)化這三個必經(jīng)階段之后,F(xiàn)orce大會上的字節(jié)展現(xiàn)出了“更強模型”的能力。
我們不妨從數(shù)字角度,來理解這次的豆包大模型的全面升級:
此次推出的通用模型pro,相較5月15日發(fā)布版本,綜合任務(wù)處理能力較5月份提升32%,在推理上提升13%,在指令遵循上提升9%,在代碼上提升58%,在數(shù)學上提升43%,在專業(yè)知識領(lǐng)域能力提升54%,能力已全面對齊GPT-4o;
音樂模型從生成60秒的簡單結(jié)構(gòu),升級到生成3分鐘的完整作品;
文生圖模型2.1版本,更是在業(yè)界首次實現(xiàn)精準生成漢字和一句話P圖的產(chǎn)品化能力。
發(fā)布豆包3D生成模型,支持文生3D、圖生3D及多模態(tài)生成,以及復(fù)雜物品、物品組合大規(guī)模場景生成,支持多模態(tài)3D資產(chǎn)編輯。
更值得重點關(guān)注的是,在開幕式上率先正式發(fā)布的豆包視覺理解模型,將能夠為企業(yè)提供極具性價比的多模態(tài)大模型解決方案。
很顯然,在一個信息80%來自于視覺的世界里,視覺理解將極大的拓展大模型的能力邊界,同時也將降低人們與大模型交互門檻,為大模型解鎖更豐富的應(yīng)用場景。
根據(jù)火山引擎總裁譚待介紹,豆包視覺理解模型不僅能精準識別視覺內(nèi)容,還具備出色的理解和推理能力,可根據(jù)圖像信息進行復(fù)雜的邏輯計算,完成分析圖表、處理代碼、解答學科問題等任務(wù);此外,該模型有著細膩的視覺描述和創(chuàng)作能力。
此前,豆包視覺理解模型已經(jīng)接入豆包App和PC端產(chǎn)品。明年1月,豆包視頻生成大模型還將正式發(fā)布,在視覺這個最重要的模態(tài)上面,字節(jié)產(chǎn)品擁有不小優(yōu)勢。
02 火山引擎的AI普惠理念,是科技發(fā)展的必然走向今天的大模型競爭,讓我常常想起70年前,美國原子能委員會主席的劉易斯施特勞斯,在1954年全國科學作家協(xié)會的演講中,他一錘定音的提到“Too cheap to meter”(太過廉價而無需計量),這一短語從此一炮走紅:
“我們可以期望:我們的子孫后代將在家中享受(too cheap to meter)廉價到無需計量的電能;世界上周期性的地區(qū)性大饑荒將被視為歷史事件;我們將毫不費力地在海上、海底和空中旅行,危險極小,速度極快;隨著人類逐漸了解導致衰老的原因,子孫的壽命將比我們長得多!
在領(lǐng)導核能開發(fā)和管理的施特勞斯眼中,技術(shù)豐饒主義不再是一種假設(shè),而是一種堅定樂觀主義的鐵律。
這一點在互聯(lián)網(wǎng)和AI主導的比特世界成為了現(xiàn)實:今天的流量邊際成本幾乎為零,在互聯(lián)網(wǎng)領(lǐng)域?qū)崿F(xiàn)了科技物種大爆發(fā),無窮多的參差多態(tài)由此誕生。
從社交網(wǎng)絡(luò),到短視頻平臺,再到社交電商和AI大模型,一切壟斷都被無情打破,技術(shù)爆發(fā)每天都在上演。
而全球數(shù)以十億計的科技開發(fā)者和數(shù)以千萬計的互聯(lián)網(wǎng)用戶,都在這場物種大爆發(fā)中,得到了前所未有的豐饒體驗。
科技進步必然帶來廉價和普惠,而AI的普惠時代,從本次字節(jié)發(fā)布會中的定價邏輯中也可窺得一二:
在此次發(fā)布會中,能力已經(jīng)跟GPT-4o對齊的豆包通用模型pro,價格只有前者的1/8。
而最新重磅推出的豆包視覺理解模型,會把圖像編碼轉(zhuǎn)換為tokens,千tokens輸入價格僅為0.003元,也就是3厘;換算一下大概是一元錢就可處理284張720P的圖片,這一價格比國內(nèi)外同行便宜85%。
低價并不是想挑起行業(yè)在供給側(cè)的價格戰(zhàn),而遵循的是火山引擎技術(shù)進步帶來AI普惠愿景:
豆包大模型的普惠,不是簡單的不計成本價格戰(zhàn),而是通過更強的技術(shù)優(yōu)化,降低使用成本,讓更多用戶都能用得起多模態(tài)模型的同時,豆包大模型本身仍然能保持合理毛利。
我們不妨用火山引擎總裁譚待自己的朋友圈來說明這個問題:豆包大模型能力強和價格低的背面,仍然能夠獲得合理的毛利,是技術(shù)能力,工程能力,軟硬件結(jié)合能力的綜合體現(xiàn)。
一如當年的互聯(lián)網(wǎng)的繁榮,靠的絕不是小院高墻式的價格歧視,而是基于開源的AI普惠邏輯:只有建立在AI普惠基礎(chǔ)上物種大爆發(fā),才會帶來全行業(yè)的更健康高速的增長。
03 更低門檻,技術(shù)普惠的開啟更強的模型,搭配更低的使用價格,讓使用者、開發(fā)者、B端企業(yè)的使用門檻都被大大降低了。與企業(yè)生產(chǎn)力相關(guān)的B端場景,豆包大模型也獲得了眾多企業(yè)客戶青睞。
今天,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到多家手機、PC等智能終端,覆蓋終端設(shè)備約3億臺,來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長100倍。
最近3個月,豆包大模型在信息處理場景的調(diào)用量增長了39倍,客服與銷售場景增長16倍,硬件終端場景增長13倍,AI工具場景增長9倍,學習教育等場景也有大幅增長。
此外,本次發(fā)布會火山引擎升級了火山方舟、扣子和HiAgent 三款平臺產(chǎn)品,幫助企業(yè)構(gòu)建好自身的 AI能力中心,高效開發(fā) AI 應(yīng)用;其中,火山方舟發(fā)布了大模型記憶方案,并推出prefix cache 和 session cache API,降低延遲和成本。
火山方舟還帶來全域 AI 搜索,具備場景化搜索推薦一體化、企業(yè)私域信息整合等服務(wù)。
04 科技就是一個普惠史縱觀人類科技發(fā)展史,就是一個用更低的價格做出更好的產(chǎn)品、完成最大程度普惠的過程。
如芯片上晶體管密度在摩爾定律的指導下快速提升,但單位晶體管的制造成本卻以更快的速度下降,這也才有了后來所有人都能用得起的電視、電腦、手機以及互聯(lián)網(wǎng)。
在近幾年,馬斯克更是將特斯拉汽車的價格,從最初的166萬,降到100萬以內(nèi),再降到50萬以內(nèi),現(xiàn)在是30萬以內(nèi),未來計劃推更平價的版本。這種策略才使得優(yōu)質(zhì)好價新能源汽車得以在全球快速普及。
一如當年的互聯(lián)網(wǎng)時代,平臺和用戶,形成了相互促進的雙邊“網(wǎng)絡(luò)效應(yīng)”,最后大幅降低了實體經(jīng)濟的交易成本,并催生出欣欣向榮的新經(jīng)濟業(yè)態(tài),讓全球至今仍在受益。
AI在大發(fā)展兩年之后,摸索出方法的頭部企業(yè),也開始進入生態(tài)構(gòu)建階段。
如果我們站在生態(tài)角度,就更能理解火山引擎字面的真實含義:火山意味著爆發(fā),AI在B端和C端應(yīng)用的層出不窮;但爆發(fā)需要有強力的引擎,也就是極強的經(jīng)濟性,只有將模型使用成本降下來,才能發(fā)揮出引擎的作用。
以這次發(fā)布的豆包視覺理解模型為例,在普惠的基礎(chǔ)上,該模型彩可以更好的在眾多日常生活場景中大顯身手:
電商場景,用豆包視覺理解模型構(gòu)建出多模態(tài)的 AI搜索和推薦,幫助用戶輕松實現(xiàn)拍照找同款,而且基于已經(jīng)購買的商品,可以去進一步的推薦適合的穿搭,客戶體驗全面升級;在電商營銷側(cè),還可以幫助商家充分描述商品細節(jié),高效發(fā)布種草廣告。
教育場景,豆包視覺理解模型不僅可以讓傳統(tǒng)的拍照搜題更加智能,還可以進一步對孩子的作業(yè)進行批改和針對性的輔導,優(yōu)化作文、科普知識,提高兒童教育效率。
旅游場景,幫助游客看外文菜單、講解照片中建筑的背景知識等等。
不僅僅是以上場景,豆包視覺理解模型在發(fā)布之前,已經(jīng)協(xié)同數(shù)百家企業(yè)進行了測試。由于普惠性,未來視覺大模型的應(yīng)用,必將涉及金融、醫(yī)療、教育、建筑、體育、物流等諸多行業(yè)。
05 結(jié)語AI大模型的核心底層價值之一,仍然是基于信息將人在場景中進行連接。
今天火山引擎推動的高性能、低成本模型,讓每一位開發(fā)者和每一家企業(yè)都能用得起。而創(chuàng)新的力量,往往來自很多看似并不起眼的小團隊。當越來越多有想法、有沖勁的創(chuàng)業(yè)者投身AI大潮中,大模型或許很快就會走進每個人的生活。