作者|Cora Xu,編輯|Zuri
十大焦點引領生成式AI投資風向!2025投資機會早知道2024年,AI重新定義了一切。
英偉達成為最會賺錢的“賣鏟人”,不聲不響地將公司市值推向3.5萬億美元高點,其數(shù)據(jù)中心業(yè)務更是在12個月內(nèi)創(chuàng)下近1000億美元收入。
相對應地,Microsoft、Meta、Amazon、Google四大科技巨頭先后在AI領域砸入1500多億美元,資本支出增長超50%。
AI熱潮之下,風險投資家們也沒閑著,PitchBook數(shù)據(jù)顯示,截至12月中旬,2024年AI初創(chuàng)公司獲得810億美元投資,AI初創(chuàng)投資占據(jù)美國所有投資的41%。
同時,2024年科技企業(yè)通過要約收購籌集資金超過了通過IPO籌集資金,IPO荒漠依然持續(xù)。更多科技創(chuàng)企選擇在私人市場尋求資本,而非冒險公開上市。
2024年我們回望科技周期下的時代巨變,2025年投資者們將繼續(xù)積極尋找下一個百億級、千億級平臺級企業(yè)。
在新年伊始之際,我們對2025年生成式AI投資機會給出十大展望:
1、AI將會釋放PGC、UGC內(nèi)容創(chuàng)作潛力,使內(nèi)容消費更加豐富多元化。
2、AI將逐漸改變?nèi)伺c人、人與信息交互的方式,形成新的流量入口,提高消費者體驗以及互動體驗。
3、AI搜索、推薦改變信息的分發(fā)方式,將會創(chuàng)造新的商業(yè)機會。
4、企業(yè)用戶對GenAI態(tài)度將從嘗試轉(zhuǎn)向大規(guī)模采用,AI代碼、AI客服支持、企業(yè)級搜索和AI會議工具將成為首批落地應用的場景。
5、企業(yè)級AI應用正從Copilot向Agent轉(zhuǎn)變,AI Agent應用將從試驗品階段走向產(chǎn)品階段,進入實際的應用場景并為用戶帶來效率提升。Coding Agent、GTM Agent(銷售智能體)可能會成為其中發(fā)展最快的兩個場景。
6、AI SWE將會逐漸從Pilot產(chǎn)品轉(zhuǎn)變?yōu)殚_發(fā)團隊生產(chǎn)環(huán)境中使用的產(chǎn)品,并產(chǎn)生收入。
7、垂直AI應用將逐步滲透至行業(yè)內(nèi)部。
8、視頻生成模型將成為AI認識物理世界的引擎,為用戶提供可實時交互的視效體驗。
9、AI數(shù)據(jù)基建價值凸顯,掌握高質(zhì)量數(shù)據(jù)集將成為模型能力分化的關鍵點。
10、機器人數(shù)據(jù)解決方案將在2025年或更長一點時間內(nèi)取得一定突破。
AI將會釋放PGC、UGC內(nèi)容創(chuàng)作潛力
使內(nèi)容消費更加豐富多元化
我們曾在2024年年底較為詳細講述了AI在消費級AI應用領域的機會。具體而言,落到電商、音樂、社交、游戲、旅行和教育等直接To C領域中,各有生成式AI原生應用的創(chuàng)新機會。
以旅行為例,Wanderboat是面向消費者的AI旅行規(guī)劃工具,也是旅游內(nèi)容分享社區(qū)。它構建了一個chatbot,可以根據(jù)用戶需求推薦、定制目的地及各類娛樂體驗活動,還可以主動學習用戶的興趣,定制專屬行程。基于創(chuàng)始人此前在微軟的經(jīng)驗,構建了一些很有趣的小工具,比如用戶在查看地圖時也可以與AI互動,實時獲取一些信息和建議。在零付費推廣的情況下,該公司的月活用戶數(shù)量達到了6位數(shù)。
在教育方向,Speak此前就是教育軟件公司,擁抱GenAI之前就已經(jīng)擁有超10萬名付費戶;趹魯(shù)據(jù)庫,Speak推出了專有語識別的模型Whisper,專門于理解10多種語的說話者發(fā)出的重英語,并推出AI 語言導師功能。
該公司于2016年成,2022年獲得了OpenAI、Founders Fund投資,Speak前在全球40多個國家/地區(qū)擁有超過1000萬戶。今年6最新的輪融資中,該公司估值達到了5億美。
視頻方向,Runway成于2018年,是最早的波做AI視頻成的公司之。Runway最初業(yè)務是AI視頻編輯,轉(zhuǎn)向到視頻渲染成。2023年2,Runway發(fā)布了第代視頻成模型Gen-1,估值也達到15億美。
Runway是一個基于人工智能和機器學習的創(chuàng)意工具平臺,專注于為創(chuàng)作者提供各種AI功能,簡化創(chuàng)意表達過程并提升工作效率。它集成了多個AI模型,支持視頻編輯、圖像處理、文本生成、音頻處理等多種功能。今年6,Runway旗下最新版本Gen-3 Alpha模型發(fā)布,最新輪估值或達到40億美。
視頻成領域投融資是GenAI領域最活躍賽道之,大廠企業(yè)和初創(chuàng)公司共同瞄準這一細分方向。面對擁有更豐富資源、更完整生態(tài)的大廠,初創(chuàng)企業(yè)在創(chuàng)新功能、創(chuàng)新產(chǎn)品上的優(yōu)勢常常會被模范以及超越,初創(chuàng)企業(yè)需要盡早找到自己的立足根本,逐漸成長為百億級企業(yè)。同時,新AI產(chǎn)品也會釋放PGC、UGC內(nèi)容創(chuàng)作潛力,讓內(nèi)容消費更加豐富多元化。
AI將逐漸改變?nèi)伺c人、人與信息交互的方式
形成新的流量入口
提高消費者體驗以及互動體驗
據(jù)觀察,隨著AI基石模型的進化,從消費側(cè)思考的B2C銷售、營銷、客服等企業(yè),都在持續(xù)產(chǎn)生新的AI故事。
首先是多模態(tài)AI營銷,從文字延展到音頻、視頻,形式從單點chatbot延展到具有操作執(zhí)行能力的agent,并且準確率和對于邊緣案例的覆蓋力隨著基石模型推理能力的提升增強。
此外,如果生成式AI運用得當,銷售、營銷、客服對消費者的洞察進一步提高,可以創(chuàng)造更加個性化的服務、定制化體驗。
代表企業(yè):GigaML、Proactive、Para、HeyGen、AdsGency
GigaML:是YC孵化的一家AI客服初創(chuàng),成立于2023年,它幫助企業(yè)以安全的方式在自己的服務器上部署類似GPT-4的強大LLM,而無需將敏感信息發(fā)送到外部服務器。GigaML還提供AI驅(qū)動客戶支持代理,利用LLM自動化響應并提供個性化幫助。GigaML發(fā)現(xiàn)將基石模型切換至o1-preview,加上大量評估、調(diào)優(yōu)之后,錯誤率大幅下降,從70%降至5%,并能夠解決80%的邊緣案例,補上了AI客服在不常見的問題上無法回應的短板,提高企業(yè)升級的動力。
Proactive:是UpHonest投資的,為商家打造高情商、高智能的AI客服,先從服務健身房、餐飲等實體連鎖商家切入市場。GPT、Llama等模型具備基礎推理和生成能力,但在自然、高情商交互方面有所欠缺,Proactive旨在增強AI模型的自然、高情商交互能力,創(chuàng)造全新體驗,改變客服工具機械、僵化的現(xiàn)狀。該公司創(chuàng)始團隊有非常豐富的AI學術研究和產(chǎn)品開發(fā)經(jīng)驗,CEO曾在雅虎、領英、谷歌、Meta擔任高管,曾擔任Tinder前CTO,首席科學家是麥吉爾大學教授,曾在Tinder、三星AI中心擔任首席科學家。
Para:是聲音營銷企業(yè)的典型案例,利用AI生成個性化定制的聲音營銷電話,幫助品牌激活用戶,幫助球隊活躍粉絲;HeyGen:是AI視頻營銷的典型案例,其AI視頻營銷收入快速增長,據(jù)悉今年的年化ARR超過2000萬美元,估值已達到5億美元。
AdsGency:則是一個利用AI用戶數(shù)據(jù)洞察,實現(xiàn)精準廣告營銷的公司,創(chuàng)始人此前曾在滴滴、亞馬遜從事廣告、營銷相關的產(chǎn)品工作。它的業(yè)務核心是廣告和用戶數(shù)據(jù),為客戶提供了一個全棧AI營銷工具,覆蓋內(nèi)容創(chuàng)意、創(chuàng)作、投放、歸因等流程。AdsGency也代表了現(xiàn)在AI營銷的一個發(fā)展趨勢 從Point Solution,到整個GTM的全流程自動化解決方案。
AI搜索、推薦改變信息的分發(fā)方式
將會創(chuàng)造新的商業(yè)機會
搜索,作為線上流量的第一入口,已經(jīng)久無戰(zhàn)事,生成式AI引入了新變量,不但出現(xiàn)了原生的生成式AI搜索企業(yè),例如Perplexity,2年時間公司價值90億美元。而且,GenAI使垂直領域的搜索引擎加速普及,瓜分通用搜索引擎的注意力。亞馬遜、沃爾瑪也均加強電商搜索引擎建設,先后推出來搜索助手,Agent智能體等工具。
我們先看一些AI原生搜索的最新動向。大公司方向,Meta近期正在加速研發(fā)搜索引擎,希望降低用戶對谷歌和Bing的依賴。OpenAI在7月發(fā)布AI搜索工具SearchGPT,其付費用戶均可使用。
創(chuàng)企方面,AI搜索初創(chuàng)You. Com專注于用 AI 提升搜索體驗的平臺。它不僅可以更精準地理解你的自然語言搜索,還能提供各種AI工具。近期該公司完成5000萬美元融資,價值7億美元。
同時,我們正在看到更多垂直領域生成式AI搜索引擎出現(xiàn),越來越多創(chuàng)企專注打造某一細分賽道的搜索引擎。
以企業(yè)知識數(shù)據(jù)庫、電商購物以及科研領域方向為例:
垂直于企業(yè)知識數(shù)據(jù)庫的搜索
Glean:成立于2019年,是一家提供企業(yè)級AI搜索服務的公司,其主要產(chǎn)品是企業(yè)AI搜索工具,旨在幫助企業(yè)員工高效地查找和管理企業(yè)內(nèi)部信息。Arvind Jain擔任Glean創(chuàng)始人和CEO,曾在谷歌工作11年,擔任杰出工程師,領導過谷歌搜索、地圖和YouTube等多個團隊。該公司于2024年9月份2.6億美元E輪融資,估值達到46億美元,據(jù)悉,該公司近兩年中ARR翻倍增長。
垂直于電商購物的搜索
DayDream:種子輪拿到了5000萬美元投資,F(xiàn)orerunner、Index聯(lián)合領投。DayDream鏈接了超過2000+品牌,支持自然語言檢索,根據(jù)用戶提供的時間、地點、場合等信息給予相關產(chǎn)品推薦。
Encore:是YC24新一期孵化項目,是一個LLM驅(qū)動的針對二手商品購物的搜索引擎,鏈接美國多個二手商品網(wǎng)站,支持自然語言搜索&按照主題的搜索。
垂直于科研場景的搜索
Consensus:與Perplexity有共同的投資人Nat Friedman和Daniel Gross,專注打造服務科研的搜索引擎,改變?nèi)藗儷@取和使用學術文獻的方式。2024年收入增長了600%,月活40萬用戶,ARR近200萬美元。
我們認為,明年會出現(xiàn)更多令人眼前一亮的垂直領域的AI搜索創(chuàng)新。
企業(yè)用戶對GenAI態(tài)度將從嘗試轉(zhuǎn)向大規(guī)模采用
AI代碼、AI客服支持、企業(yè)級搜索和AI會議工具
將成為首批落地應用的場景
生成式AI應用將從實驗走向落地,根據(jù)Menlo Ventures統(tǒng)計數(shù)據(jù),2024年企業(yè)中AI相關支出達到了138億美金,相比2023年的23億美金增長了6倍以上。在這其中,雖然模型支出占據(jù)主要部分,但是應用支出增速最快,從2023年的6億美金增長到了今年的46億美金。
顯然,生成式AI正在從一個新興的技術轉(zhuǎn)變?yōu)橐粋使用工具。在眾多應用中,最具價值的應用場景分別是:AI代碼、AI客服支持、企業(yè)級搜索和AI會議工具。
我們認為在2025年,企業(yè)對于AI支出將保持增長。據(jù)統(tǒng)計,目前企業(yè)60%的AI支出來自創(chuàng)新業(yè)務的預算,未來企業(yè)將劃分更多傳統(tǒng)開支預算到AI應用上。由此,我們也會看到更多GenAI初創(chuàng)達到1億美金ARR的里程碑。
企業(yè)級AI應用正從Copilot向Agent轉(zhuǎn)變
AI Agent應用將從實驗品轉(zhuǎn)向產(chǎn)品
進入實際的應用場景并為用戶帶來效率提升
AI快速發(fā)展同時,企業(yè)也迅速借助技術力量轉(zhuǎn)型升級。就當下企業(yè)的采用情況而言,出于安全性、準確性、穩(wěn)定性等因素的考量,企業(yè)更傾向于使用AI提高人在工作流中的效率,而不是直接采用端到端的流程自動化。
我們認為,在未來幾年會逐漸從AI賦能人工作,到人監(jiān)管指導AI完成工作,轉(zhuǎn)向AI自主完成工作。
OpenAI CEO Sam Altman也同樣提到,當下正處于AGI演進過程中第二階段后期轉(zhuǎn)向第三個階段前期的狀態(tài)。他認為Level 3的Agent智能,將能夠自主與環(huán)境交互、收集信息,具備持續(xù)規(guī)劃并執(zhí)行多步驟、長時間任務的能力,并能在遇到問題是與人類交互共同解決復雜任務。
并且,如果接下來我們能夠看到推理能力、邏輯能力更強的模型出現(xiàn),可能是o1的下一個版本、也能是對標o1的開源模型。同時,行業(yè)內(nèi)出現(xiàn)了更強Agent Infra(智能體基礎設施),也就是除了模型以外,支持AI Agent(智能代理)運行和開發(fā)的各種基礎設施。那么,我們認為,在2025年,AI Agent應用將從試驗品走向產(chǎn)品,進入實際的應用場景并為用戶帶來效率提升。其中,Coding Agent、GTM Agent(Go To Market Agent)可能是發(fā)展最快的兩個場景。
代表創(chuàng)企:/dev/Agents
公司成立于2024年10月,聯(lián)合創(chuàng)始人兼首席執(zhí)行官David Singleton曾任谷歌工程副總裁和Stripe首席技術官;聯(lián)合創(chuàng)始人兼首席技術官Ficus Kirkpatrick曾負責Android 1.0版本的開發(fā);聯(lián)合創(chuàng)始人兼首席產(chǎn)品官Hugo Barra曾擔任小米全球副總裁前谷歌安卓系統(tǒng)產(chǎn)品管理副總裁。
目前公司主要打造開發(fā)一個專為人工智能代理(AI Agents)設計的操作系統(tǒng),對標AI界的“安卓系統(tǒng)”。/dev/Agents 在2024年11月完成了5600萬美元的種子輪融資,估值達5億美元。
此外,在最新一期YC中,我們也看到了不少專為AI代理設計打造可觀測性和開發(fā)工具平臺的初創(chuàng)公司。
AI SWE將會逐漸從Pilot產(chǎn)品轉(zhuǎn)變?yōu)殚_發(fā)團隊生產(chǎn)環(huán)境中使用的產(chǎn)品,并產(chǎn)生收入
AI SWE將擴大開發(fā)者人群的規(guī)模上限。
從今年企業(yè)應用以及Agent落地情況來看,代碼方向的企業(yè)和應用發(fā)展速度非?。這是因為:
軟件開發(fā)本質(zhì)上天然能夠?qū)碗s任務拆解成更小、更易于管理子任務。并且,受益于大模型推理能力的升級,現(xiàn)階段用于模型訓練、Agent訓練的數(shù)據(jù)比較充足。
同時,軟件開發(fā)和代碼任務的結果可驗證性強,開發(fā)者能夠可以客觀、定量的去衡量輸出的準確性和可靠性。
此外,軟件工程師用戶群體天然離科技前沿更近,更愿意為效率的提升去嘗試、去付費。
在今年行業(yè)發(fā)展中,我們看到從最早僅有Github Copilot平臺,現(xiàn)在已經(jīng)有了一屏都放不下的 Logo Map。
我們認為2025年:SWE-bench Verified測評分數(shù)有望突破現(xiàn)有最高分55%,超過70%。這也意味著AI SWE會逐漸從Pilot產(chǎn)品轉(zhuǎn)變?yōu)殚_發(fā)團隊生產(chǎn)環(huán)境中使用的產(chǎn)品,并產(chǎn)生收入。
在SWE-bench之前,HumanEval曾是衡量模型代碼能力的標準,當其榜單上平均水平達到70%以上時,以Copilot為代表的代碼補全應用具備了商業(yè)上可行的技術基礎。
此外,如果我們將目光放得更長遠一些的話,AI SWE將擴大開發(fā)者人群的規(guī)模上限。
更多沒有代碼經(jīng)驗專業(yè)人士有機會獲得軟件開發(fā)的能力,并使用這個能力去開發(fā)適合自己的效率工具或者是娛樂應用。我們也看到了很多公司正為非開發(fā)專業(yè)人群構建工具。
代表企業(yè):Cosine
Cosine成立于2022年,專注于開發(fā)類人自主人工智能軟件公司,其核心產(chǎn)品是自主AI工程師Genie,能夠執(zhí)行復雜的編碼任務,如代碼重構、搭建功能以及修復Bug。Alistair Pullen擔任首席執(zhí)行官,他自小對編程感興趣,9歲時發(fā)布了并商業(yè)化了他的第一個軟件應用程序。Yang Li擔任首席運營官,曾經(jīng)歷1次企業(yè)IPO、2次企業(yè)收購以及3家獨角獸企業(yè)。
Cosine在2024年8月獲得了250萬美元的種子輪融資,本輪融資由UpHonest Capital和SOMA Capital領投。同時,Cosine是OpenAI模型Finetune團隊的重要合作伙伴,并且研發(fā)出了一個獨特的數(shù)據(jù)管道。
垂直AI應用將逐步滲透至行業(yè)內(nèi)部
可以看到,今年在醫(yī)療、金融、法律等領域都出現(xiàn)不少明星初創(chuàng)公司。雖然這些行業(yè)本身對于科技采用速度較慢,但是生產(chǎn)式AI通過直接交付成果取代傳統(tǒng)交付軟件模式,讓垂直行業(yè)迅速看到了AI帶來的效率提升。
2025年,我們認為垂直行業(yè)AI應用依然是很好的創(chuàng)業(yè)方向。
在通用場景的方向創(chuàng)業(yè),勢必會面臨基石模型廠商、頭部科技公司的競爭,一些垂直行業(yè)雖然屬于細分賽道但整體規(guī)模仍然非?捎^,大部分垂直領域在傳統(tǒng)巨頭的壟斷下變化緩慢。
一些垂直領域?qū)<覍π袠I(yè)的工作流有深入認知的創(chuàng)業(yè)者,結合不斷進化GenAI基礎設施,是有機會迅速搶占用戶,形成行業(yè)數(shù)據(jù)壁壘的。
我們特別強調(diào)關注傳統(tǒng)行業(yè)AI升級機會。數(shù)字化滲透率低傳統(tǒng)行業(yè),甚至有可能跳過軟件階段,直接進入AI階段,類似新興市場從使用現(xiàn)金直接轉(zhuǎn)向移動支付機會。如今,傳統(tǒng)制造業(yè)、家庭服務行業(yè)存在較大的市場空白。
視頻生成模型將成為AI認識物理世界的引擎
為用戶提供可實時交互的視效體驗
今年隨著Sora發(fā)布出圈,我們看到了很多視頻生成模型初創(chuàng)公司的涌現(xiàn)。一些原從事3D圖像生成的企業(yè)如Luma AI、Genmo AI,今年也轉(zhuǎn)向了視頻生成賽道。
2025年,我們認為將視頻生成模型作為AI認識物理世界的引擎,為用戶提供可實時交互的視效體驗。
其中,游戲應用場景將會是變化較快的場景。其中,視頻生成模型作為游戲引擎,可以根據(jù)用戶的輸入輸出響應游戲內(nèi)容,讓每次的體驗都有所不同。
但現(xiàn)階段,這些demo的畫質(zhì)和幀率并不高,題材也相對單一。我們認為,隨著大量的資金和類似馬斯克、蔡浩宇這類大佬進入這個領域,底層模型的性能會迎來迅速的提升。底層模型提升后,會迎來更多游戲之外應用想象空間。
代表企業(yè):Decart
公司成立于2023年9月,主要專注于開發(fā)能夠?qū)崟r生成視頻游戲和世界模型的平臺,提供AI驅(qū)動的“開放世界”應用程序。其產(chǎn)品包括面向企業(yè)的GPU優(yōu)化工具和面向消費者的AI游戲“Oasis”,其產(chǎn)品形態(tài)與Minecraft相似,但是完全由視頻模型驅(qū)動。
Dean Leitersdorf聯(lián)合創(chuàng)始人兼首席執(zhí)行官,23歲在以色列理工學院獲得博士學位。Decart在2024年12月完成了3200萬美元的A輪融資,該輪融資后,Decart的估值已超過5億美元。
AI數(shù)據(jù)基建價值凸顯
掌握高質(zhì)量數(shù)據(jù)集
將成為模型能力分化的關鍵點
對于基石模型來講,掌握高質(zhì)量的數(shù)據(jù)集或?qū)⒊蔀槟P湍芰Ψ只年P鍵點,對于應用來講,無論是消費級、企業(yè)級AI應用,構建專有數(shù)據(jù)集的能力是重要的護城河。
目前,業(yè)內(nèi)公開、可爬取的互聯(lián)網(wǎng)數(shù)據(jù)幾乎都被用于模型訓練,基石模型廠商需要尋找全新、未使用高質(zhì)量、人類生成的訓練數(shù)據(jù)用以構建更先進AI系統(tǒng)。
OpenAI專門成立了一支團隊,研究如何解決訓練數(shù)據(jù)匱乏問題。那對于初創(chuàng)來說,數(shù)據(jù)更是他們不可或缺的護城河。數(shù)據(jù)代表了初創(chuàng)可以再多大程度上提升AI模型在實際應用中的準確度和覆蓋應用的能力。
我們從兩個角度觀察現(xiàn)有的AI數(shù)據(jù)基建的價值:通用基石模型數(shù)據(jù)和垂直AI模型數(shù)據(jù)。
在通用底層模型/基石模型方向,OpenAI專門成立了一支團隊,研究如何解決訓練數(shù)據(jù)匱乏問題。有報道稱,GPT-5訓練過程中使用了部分GPT-4和其他模型生成數(shù)據(jù),導致GPT-5在一些方面難以避免產(chǎn)生了與這些模型相似性。
創(chuàng)企方面,Scale AI和AI創(chuàng)企Turing也憑借著優(yōu)質(zhì)數(shù)據(jù)集快速發(fā)展。從CV數(shù)據(jù)標注起家的數(shù)據(jù)服務商Scale AI,預計今年產(chǎn)生9.5億美元收入,估值高達138億美元。該公司主要為OpenAI、Anthropic等頭部AI模型廠商提供專業(yè)人員標注和生成的數(shù)據(jù)集,今年收入翻倍增長,估值超過20億美元。
2019年創(chuàng)立的AI創(chuàng)企Turing,主要利用數(shù)據(jù)科學和人工智能相結合的方法,幫助企業(yè)進行招聘、審查和管理工具,打造一款AI企業(yè)招聘平臺,也是UpHonest投資的創(chuàng)企之一。
a16z、Benchmark投資人同樣關注垂直賽道的機會。相較于通用模型方向,垂直賽道企業(yè)數(shù)字化滲透率較低,其生成式AI應用有潛力快速滲透,一旦形成數(shù)據(jù)飛輪,垂直賽道的創(chuàng)企可以積累自己的專有數(shù)據(jù)壁壘,當然如果創(chuàng)始人具備該垂直領域的深厚經(jīng)驗,更加有利于打造產(chǎn)品、構建壁壘。
代表企業(yè):Lily、Casetext、Centaur Labs
Lily AI:成立于2018年,專注挖掘電商數(shù)據(jù)價值,主要借助AI打造電商優(yōu)化產(chǎn)品推薦和搜索體驗的SaaS平臺。它通過分析產(chǎn)品數(shù)據(jù)和客戶行為,為產(chǎn)品描述、搜索結果和營銷活動注入自然、以客戶為中心的語言,從而提升購物體驗和轉(zhuǎn)化率。該公司認為電商搜索面臨的一大問題是消費者語境和商家語境的錯位,為此搭建了零售行業(yè)最大的商品數(shù)據(jù)集,覆蓋8000多萬產(chǎn)品、具備幾十億標簽數(shù)據(jù),基于此優(yōu)化商家的搜索表現(xiàn)。Lily AI于2022年8月完成 2000萬美元B1輪融資。
Casetext:專注法律數(shù)據(jù)價值,其創(chuàng)始人律師出身,在公司早期階段打造了一個開源的法律案例數(shù)據(jù)庫,在接入GPT-4之前,本身積累了豐富專有數(shù)據(jù),通過反復試驗、糾錯、調(diào)試,打造了自己專有的模型微調(diào)數(shù)據(jù)集,極大減少了基石模型在實際工作中幻覺。并且,該公司還打造了用于法律研究和訴訟的AI驅(qū)動工具CoCounsel,律師客戶對其產(chǎn)品準確度非常滿意。該公司在2023年被湯森路透以6.5億美元的價格收購。
Centaur Labs:則是一家專注于醫(yī)療數(shù)據(jù)標注的公司,擁有一個由數(shù)萬名醫(yī)生和學生組成的標注團隊,主要提供高質(zhì)量的醫(yī)療數(shù)據(jù)標簽,以推進醫(yī)療人工智能的發(fā)。該公司的服務包括醫(yī)學圖像(如X射線、CT/MR、皮膚科、眼科、病理學)、視頻(如手術視頻、超聲波)、文本(科學文本、醫(yī)學筆記)和音頻記錄(心肺音)的標注。2024年10月9日,Centaur Labs 完成了1600萬美元的B輪融資,由SignalFire領投,Matrix、Susa Ventures、Samsung Next和Alumni Ventures參。
總結來說,我們認為有以下三點數(shù)據(jù)相關的機會值得關注:
一是挖掘更多類型、更多模態(tài)數(shù)據(jù)集的價值,包括用爬蟲擴展數(shù)據(jù)體量、非結構化數(shù)據(jù)處理等;
二是通過數(shù)據(jù)篩選、清洗、標注,提供高質(zhì)量的數(shù)據(jù)集;
三是從數(shù)據(jù)版權授權、數(shù)據(jù)集交易等方面入手,擴充數(shù)據(jù)量同時解決版權問題。
2025年或3年內(nèi)
Embodied AI將迎來GPT-2時刻
數(shù)據(jù)解決方案&模型架構的創(chuàng)新是推動因素之一
回顧2024年,我們看到了大量的前沿學者和專家投身到了具身智能(EmbodiedAI)的創(chuàng)業(yè)浪潮中,資本也是投入重金支持。今年我們也做了相關的主題分享,并整理50家具身智能初創(chuàng)的圖譜。(智能革命:50家公司,26張圖,看完具身智能現(xiàn)狀)
業(yè)內(nèi)最明星的團隊Physical Intelligence在近期發(fā)布了他們第一代的模型π0,專為高度靈活、復雜且需要長時間規(guī)劃的任務設計。在Demo中能夠完成洗衣服,從烘干機中取出衣服,折疊衣服的任務。
Physical Intelligence在模型架構和訓練數(shù)據(jù)這兩方面都完成了一定程度上的突破,π0(只需要短時間的微調(diào))可以執(zhí)行一些預訓練數(shù)據(jù)中沒有出現(xiàn)過的任務,可以說是表現(xiàn)出了一定的泛化性能。
但是論文的一作者仍表示,盡管π0取得了一定的進展,但仍沒有達到GPT-2那樣變革性的水平。相比與GPT-2的訓練數(shù)據(jù)集,機器人的訓練數(shù)據(jù)規(guī)模遠遠不夠,在數(shù)量、多樣性、質(zhì)量上都不足。
因此,我們認為在2025年或者更長一點的時間中,機器人數(shù)據(jù)的解決方案會取得一定的突破。在數(shù)據(jù)和模型設計的共同迭代下,Scaling Law在Embodied AI領域發(fā)生的碰撞與變化是值得期待的。
當基石模型能力達到一定程度時,我們也將看到更多通用機器人落地的場景,目前預測,在C端家庭場景的進展是最快的,在B端則是物流倉儲零售的進展比較快。
AI熱潮涌動,科技創(chuàng)新不止
作為觀察和研究硅谷科技創(chuàng)新和創(chuàng)業(yè)投資的一線,硅兔君一直在見證著最新前沿科技進展,并且及時分享我們?nèi)粘5囊恍┬袠I(yè)觀察。
回顧過去的科技周期,可以看到每一波平臺級的機會下,都會誕生出誕生出百億美金、千億美金級別的公司。當基礎設施完善后的5年應用公司的黃金發(fā)展期。我們也一直關注在不同技術周期下,技術平臺對消費級和企業(yè)級應用的賦能。
如果大家想了解更多AI初創(chuàng)的信息,中文內(nèi)容歡迎關注公眾號硅兔君,英文內(nèi)容可以訂閱我們的Newsletter Morning VC,會有新鮮的初創(chuàng)融資和投資總結。
新的一年,硅兔君與各位繼續(xù)同行。