機器之心報道
機器之心編輯部
一家高校實驗室 ,能走出多少個知名 AI 初創(chuàng)公司的創(chuàng)始人?
強化學(xué)習(xí)大牛、UC 伯克利教授 Pieter Abbeel 淺淺統(tǒng)計了一番:我?guī)н^的學(xué)生里,也就 12 個吧。
這些公司的名氣都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都聽說過。
剛剛,Pieter Abbeel 用一句話和一張配圖,低調(diào)宣傳了一下讓他驕傲的學(xué)生們:「那些獲得博士學(xué)位或從事博士后研究的創(chuàng)始人,曾在伯克利實驗室渡過一段美好的時光,現(xiàn)在他們開始了他們的創(chuàng)業(yè)之路!
Pieter Abbeel 是加州大學(xué)伯克利分校電氣工程與計算機科學(xué)系的教授,同時也是伯克利機器人學(xué)習(xí)實驗室(Berkeley Robot Learning Lab)主任和伯克利人工智能研究實驗室(BAIR)聯(lián)合主任。
在人工智能和機器人領(lǐng)域享有盛譽的專家 Pieter Abbeel ,不僅研究成果在學(xué)術(shù)界產(chǎn)生了深遠影響,他帶出的學(xué)生在不同領(lǐng)域也取得了非凡成就。
下面我們盤點一下,Abbeel 口中的這些優(yōu)秀學(xué)生們(人名后的信息為企業(yè)名+當(dāng)前估值)。
John Schulman-OpenAl (350B)
John Schulman 是一位著名的人工智能研究科學(xué)家,尤其在強化學(xué)習(xí)和大語言模型領(lǐng)域有著重要貢獻。
2015 年 12 月,Schulman 連同奧特曼等人共同創(chuàng)立了 OpenAI,并在其中擔(dān)任重要角色。他在 OpenAI 領(lǐng)導(dǎo)了強化學(xué)習(xí)團隊,參與創(chuàng)建了 ChatGPT,并從 2022 至 2024 年共同領(lǐng)導(dǎo)了后訓(xùn)練團隊。Schulman 于 2024 年 8 月從 OpenAI 離職。
Schulman 離開 OpenAI 后,加入競爭對手 Anthropic,專注于 AI 對齊研究。然而,他在 Anthropic 僅工作了半年,于 2025 年 2 月再次離職。
今年 2 月,Schulman 成為初創(chuàng)公司 Thinking Machines Lab 的聯(lián)合創(chuàng)始人兼首席科學(xué)家。Thinking Machines Lab 是一家「人工智能研究和產(chǎn)品公司。」 CEO 為 OpenAI 前 CTO Mira Murati,她曾在 OpenAI 領(lǐng)導(dǎo)過研究、產(chǎn)品與安全方面的工作。
谷歌學(xué)術(shù)頁面顯示,John Schulman 的學(xué)術(shù)引用總數(shù)已經(jīng)超過 10 萬。其中,引用量最高的研究便是他創(chuàng)造的 PPO 算法《Proximal policy optimization algorithms》。
他在加州大學(xué)伯克利分校獲得了計算機科學(xué)博士學(xué)位,導(dǎo)師為該校教授、深度強化學(xué)習(xí)大牛 Pieter Abbeel。之后從事機器人和強化學(xué)習(xí)研究與工作。在此之前,他還曾在伯克利短暫學(xué)習(xí)過神經(jīng)科學(xué),并在加州理工學(xué)院學(xué)習(xí)過物理學(xué)。
Aravind Srinivas-Perplexity (15B)
Aravind Srinivas 是一位印度裔美國計算機科學(xué)家、企業(yè)家,因聯(lián)合創(chuàng)立 AI 初創(chuàng)公司 Perplexity AI 而廣受關(guān)注。
2018 年,他在 OpenAI 實習(xí)并參與開發(fā)強化學(xué)習(xí)項目,師從 John Schulman。
2022 年,Srinivas 與 Denis Yarats、Johnny Ho 等人聯(lián)合創(chuàng)立了 Perplexity AI,擔(dān)任首席執(zhí)行官。Perplexity AI 致力于打造世界上最值得信賴的問答引擎,其核心產(chǎn)品是一款基于大型語言模型的聊天機器人,能夠提供準確的答案和信息來源。
Aravind Srinivas 工作經(jīng)歷也非常豐富,先后就職于谷歌 DeepMind、OpenAI 等明星公司。
Aravind Srinivas 在印度理工學(xué)院馬德拉斯分校(IIT Madras)完成了電氣工程碩士學(xué)位,專注于遷移學(xué)習(xí)和強化學(xué)習(xí)研究。隨后,他前往加州大學(xué)伯克利分校深造,獲得計算機科學(xué)博士學(xué)位,研究方向包括高效深度學(xué)習(xí)訓(xùn)練方法和計算機視覺。
Deepak Pathak-Skild (4B)
Skild AI 是一家專注于機器人技術(shù)和人工智能應(yīng)用的初創(chuàng)公司,成立于 2023 年 5 月,由 Deepak Pathak 和 Abhinav Gupta 創(chuàng)立。該公司致力于構(gòu)建通用機器人智能。
Skild AI 開發(fā)了一款被稱為 Skild Brain 的可擴展機器人基礎(chǔ)模型,成為各種機器人在不同場景和任務(wù)中的通用大腦。這一模型能夠適應(yīng)不同的硬件平臺和環(huán)境,從建筑工地到工廠,再到家庭等場景。去年 7 月,Skild AI 完成 3 億美元 A 輪融資,估值達到 15 億美元。此外,2025 年 1 月,有消息稱軟銀正在談判向 Skild AI 投資 5 億美元,其估值約為 40 億美元。
我們再回到 Deepak Pathak 本人。Deepak Pathak 博士畢業(yè)于加州大學(xué)伯克利分校,導(dǎo)師是 Alyosha Efros 和 Trevor Darrell 教授。他主要專注于計算機視覺、機器學(xué)習(xí)和機器人技術(shù)的交叉研究。
之前,Deepak Pathak 在 Meta AI 研究部門擔(dān)任了一年的研究員,并在加州大學(xué)伯克利分校以訪問博士后的身份與 Pieter Abbeel 合作。
Chelsea Finn, Sergey Levine-Pl (2.4B)
Physical Intelligence(簡稱 PI 或 π)是一家專注于開發(fā)基礎(chǔ)模型和學(xué)習(xí)算法的美國初創(chuàng)公司,目標是為當(dāng)今的機器人和未來的物理驅(qū)動設(shè)備提供動力。
Chelsea Finn 是斯坦福大學(xué)計算機科學(xué)和電氣工程助理教授,也是 Pl 的聯(lián)合創(chuàng)始人。
之前,Chelsea Finn 在加州大學(xué)伯克利分校完成了計算機科學(xué)博士學(xué)位,并在麻省理工學(xué)院獲得了電氣工程和計算機科學(xué)學(xué)士學(xué)位。她還曾在谷歌大腦團隊工作過一段時間。
Sergey Levine 被認為是強化學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物之一,他的谷歌學(xué)術(shù)引用量超過 17 萬。他也是 PI 的聯(lián)合創(chuàng)始人。
Sergey Levine 現(xiàn)在是加州大學(xué)伯克利分校電氣工程與計算機科學(xué)系副教授,專注于能夠使自主智能體通過學(xué)習(xí)獲得復(fù)雜行為的算法,特別是能夠使任何自主系統(tǒng)學(xué)習(xí)解決任何任務(wù)的通用方法。這類方法的應(yīng)用包括機器人技術(shù),以及需要自主決策的其他領(lǐng)域。
Sergey Levine 2009 年獲得了斯坦福大學(xué)碩士學(xué)位,2014 年獲斯坦福大學(xué)博士學(xué)位,2016 年加入加州大學(xué)伯克利分校電氣工程與計算機科學(xué)系。他的研究涉及自動駕駛、機器人、計算機視覺和圖形學(xué)。他的研究包括開發(fā)用于深度神經(jīng)網(wǎng)絡(luò)的端到端訓(xùn)練算法,用于逆向強化學(xué)習(xí)的可擴展算法,深度強化學(xué)習(xí)算法等。
Roshan Rao-Evolutionary Scale (x00M est.)
Roshan Rao 是 EvolutionaryScale 的聯(lián)合創(chuàng)始人兼研究科學(xué)家,致力于研究蛋白質(zhì)的進化模型。此前他在 Meta AI 工作,并在加州大學(xué)伯克利分校完成了博士學(xué)位,導(dǎo)師是 John Canny 和 Pieter Abbeel。
EvolutionaryScale 是一家非盈利公司。他們的使命是通過與科學(xué)界合作以及開放、安全和負責(zé)任的研究,開發(fā)人工智能來理解生物學(xué),造福人類健康和社會。自成立以來,ESM 項目一直致力于通過代碼和模型發(fā)布來開放科學(xué),該團隊承諾將繼續(xù)堅持下去。該公司成立于 2023 年 7 月已經(jīng)完成 1.42 億美元種子輪融資,并已經(jīng)與亞馬遜(Amazon)和英偉達(NVIDIA)公司達成合作。
2024 年夏天,EvolutionaryScale 推出了 ESM3,一款面向蛋白質(zhì)語言的大模型,成功在自然進化未曾涉足的區(qū)域設(shè)計出功能性蛋白,同期上線了該研究的預(yù)印版本。
時隔半年,該研究以「Simulating 500 million years of evolution with a language model」為題,于 2025 年 1 月 16 日在《Science》發(fā)布。
Aditya Grover-Inception Al (x00M est.)
Aditya Grover 是加州大學(xué)洛杉磯分校的計算機科學(xué)助理教授,領(lǐng)導(dǎo)機器智能 (MINT) 小組開發(fā)可以在有限監(jiān)督下進行交互和推理的人工智能系統(tǒng)。
在加入 UCLA 之前,他曾在 FAIR 和 Meta 的核心機器學(xué)習(xí)團隊擔(dān)任研究科學(xué)家。此前他在加州大學(xué)伯克利分校度過了博士后生涯(導(dǎo)師為 Pieter Abbeel),在斯坦福大學(xué)完成了博士學(xué)位(導(dǎo)師為 Stefano Ermon,擴散模型的發(fā)明者之一),在印度理工學(xué)院德里分校完成了學(xué)士學(xué)位(聯(lián)合導(dǎo)師是 Mausam、Parag Singla)。
Aditya Grover 博士期間的導(dǎo)師 Stefano Ermon 于去年夏天創(chuàng)立了 Inception,并邀請他和康奈爾大學(xué)教授 Volodymyr Kuleshov 共同領(lǐng)導(dǎo)公司。
不久前, Inception 發(fā)布了首個商業(yè)級擴散大型語言模型(dLLM)Mercury,在英偉達 H100 上能以每秒超過 1000 token 的速度運行,性能媲美現(xiàn)有的經(jīng)過速度優(yōu)化的 LLM;趤碜 MidJourney 和 Sora 等圖像和視頻生成系統(tǒng)的靈感,Inception 為 Mercury 引入了一種新的語言生成方法。相比于現(xiàn)有的 LLM,這種方法的運行效率顯著更高(速度更快、成本更低),并且還可將推理成本降低 10 倍。
Peter Chen&Rocky Duan&Tianhao Zhang-Covariant (625M)
左一至左四:陳曦、Pieter Abbeel、段巖、張?zhí)旌?br/>
Covariant 是一家位于美國灣區(qū)的人工智能與機器人公司,致力于構(gòu)建先進的人工智能模型,使機器人能夠觀察、推理和應(yīng)對周圍的世界,從而支持多種不同的倉庫自動化任務(wù)。
公司成立于 2017 年,原名為 Embodied Intelligence,由 Pieter Abbeel、Peter Chen(陳曦)、Rocky Duan(段巖)和 Tianhao Zhang(張?zhí)旌疲?創(chuàng)立。Pieter Abbeel 擔(dān)任首席執(zhí)行官,Abbeel 擔(dān)任總裁兼首席科學(xué)家,段巖擔(dān)任首席技術(shù)官。
自 2008 年以來,Abbeel 一直擔(dān)任加州大學(xué)伯克利分校機器人學(xué)習(xí)實驗室主任,同時還是該校教授。三位創(chuàng)始人都是他在這所大學(xué)的學(xué)生。此外 Pieter Abbeel 和陳曦、段巖曾在 OpenAI 擔(dān)任研究員(當(dāng)時 OpenAI 解散了機器人團隊),張?zhí)旌圃俏④浹芯繂T。
在實驗室的研究基礎(chǔ)上,兩位創(chuàng)始人花了兩年多時間設(shè)計出 Covariant Brain,這是一款由人工智能驅(qū)動的軟件,可以為機械臂提供動力,使其能夠在倉庫中執(zhí)行勞動。2018 年,該公司開始收集全球倉庫中 30 種機械臂的數(shù)據(jù),所有這些機械臂都使用 Covariant Brain 運行。此后,該公司建立了一個包含數(shù)十億個現(xiàn)實世界機器人信息的數(shù)據(jù)庫。
2024 年 9 月,亞馬遜宣布聘用 Pieter Abbeel、Peter Chen 和 Rocky Duan 和 Covariant 約四分之一的員工,幫助推動 Covariant 技術(shù)在亞馬遜運營中的開發(fā)和實施,還簽署了使用 Covariant 機器人基礎(chǔ)模型的非獨家許可。
Misha Laskin-Reflection (555M)
Misha Laskin(左)和 Ioannis Antonoglou(右)
Misha Laskin 曾于 2022-2024 年任 Google DeepMind 研究科學(xué)家,此前曾在加州大學(xué)伯克利分校念博士后,是芝加哥大學(xué)理論物理學(xué)博士。他曾幫助開發(fā)谷歌 Gemini 大語言模型系列的訓(xùn)練工作流程。
不久前,他宣布了自己已經(jīng)成立一家名為 Reflection AI 的公司,旨在開發(fā)超級智能。公司一亮相,就已宣布獲得 1.3 億美元融資,估值更是高達 5.55 億美元。
除了擔(dān)任 CEO 的 Misha 之外,公司的聯(lián)合創(chuàng)始人 Ioannis 是谷歌 DeepMind 的創(chuàng)始工程師,也是 AlphaGo 的幕后功臣,還從事了 Gemini 的訓(xùn)練后系統(tǒng)工作。其他團隊成員也都是曾在 DeepMind、OpenAI 和其他前沿實驗室發(fā)揮主導(dǎo)作用的研究人員和工程師,參與打造了過去十年間一些最先進的人工智能系統(tǒng),比如 AlphaGo 和 Gemini 等。
Reflection 的愿景是構(gòu)建超級智能代理來執(zhí)行所有知識工作,這建立在兩個核心信念之上:
1. 自主編碼是邁向超級智能的關(guān)鍵一步。
2. 現(xiàn)實世界的評估 而不僅僅是基準 才是最重要的。
Jonathan Ho-ldeogram (500M est.)
Jonathan Ho 于 2020 年博士畢業(yè),他曾與 Ajay Jain、Pieter Abbeel 聯(lián)合提出了去噪擴散概率模型(Denoising diffusion probabilistic models,DDRM)。
此后,他曾在谷歌擔(dān)任研究科學(xué)家,并在 2022 年 12 月共同創(chuàng)立了 Ideogram,開發(fā)文本生成圖像模型。公司利用深度學(xué)習(xí)技術(shù)將自然語言描述(即提示詞)轉(zhuǎn)化為數(shù)字圖像。與其他文本生成圖像模型相比,Ideogram 的獨特之處在于其能夠在生成的圖像中準確地呈現(xiàn)可讀的文字內(nèi)容,這使其在創(chuàng)建包含文本元素的圖像(如標志、海報等)方面表現(xiàn)出色。
2024 年 8 月,公司發(fā)布了 Ideogram 2.0 模型,提供了現(xiàn)實主義、設(shè)計、3D 和動漫等多種風(fēng)格,并進一步提升了在圖像中生成文本的能力。
自創(chuàng)立以來,Ideogram 完成了多輪融資,包括 2023 年 8 月的 1650 萬美元種子輪融資,該輪融資由 a16z 和 Index Ventures 領(lǐng)投;以及 Ideogram 1.0 發(fā)布后獲得由頂尖風(fēng)險投資公司 a16z 領(lǐng)投的 8000 萬美元 A 輪融資。
Ajay Jain-Genmo
2023 年,Ajay Jain 博士畢業(yè)。博士期間,他的研究包括了機器學(xué)習(xí)(尤其是深度生成模型和表示學(xué)習(xí))和計算機系統(tǒng),學(xué)習(xí)了強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、計算機視覺、NLP、優(yōu)化以及近似算法和系統(tǒng)方面的知識。
他是 DDPM 和 DreamFusion 的共同創(chuàng)建者。他們的工作為包括 Stable Diffusion 和 DALL-E 2 在內(nèi)的所有現(xiàn)代擴散模型奠定了基礎(chǔ)。
他曾在 Google Brain 工作,創(chuàng)建了首個文本到 3D 生成模型。2022 年 12 月,他共同創(chuàng)立了 Genmo AI 并擔(dān)任 CTO,這是一家專注于視頻生成的 AI 公司。
2024 年 10 月,Genmo 推出了 Mochi 1 開源視頻生成模型的研究預(yù)覽版本,可以實現(xiàn)高保真運動和強大實時性,尤其在遵循用戶詳細指令方面做得很好。
Ariun Singh-Gradescope
Arjun Singh 于 2016 年博士畢業(yè)。
2014 年,Arjun Singh 與 Pieter Abbeel、Sergey Karayev(另一位博士)共同創(chuàng)立了 Gradescope,一款利用人工智能輔助教師評分的工具。
圖源:從左到右依次為 Gradescope 聯(lián)合創(chuàng)始人 Pieter Abbeel、Arjun Singh 和 Sergey Karayev。
根據(jù) Crunchbase 的信息,Gradescope 已完成多輪融資,投資方包括 Khosla Ventures、Reach Capital 和 Gradient Ventures 等知名機構(gòu)。不過,具體的融資金額和輪次并未公開披露。
值得注意的是,2018 年,Gradescope 被 Turnitin 收購。此后,Gradescope 繼續(xù)作為 Turnitin 旗下的產(chǎn)品運營,致力于為教育工作者提供高效的批改和反饋工具。
Philipp Wu&Fred Shentu-Stealth
Philipp Wu 現(xiàn)為 Pieter Abbeel 的博士生(2021 年 8 月到 2026 年 5 月)。他的研究興趣在于現(xiàn)實世界的通用機器人,研究涉及到了強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和機器人技術(shù)的交叉融合。
他在 Pieter Abbeel 負責(zé)的機器人學(xué)習(xí)實驗室(Robot Learning Lab)工作,內(nèi)容包括創(chuàng)建低成本、對人類安全、7 自由度的柔性機械臂,被稱為「Blue」,應(yīng)用包括輔助家庭護理、深度強化學(xué)習(xí)、模仿學(xué)習(xí)和抓取。此外,他還研發(fā)了一個機器人動力學(xué)和運動學(xué)模型以及一個用于測試控制算法的「Gazebo」模擬器,等等。
Yide (Fred) Shentu 現(xiàn)為 Pieter Abbeel 的博士生。他本科同樣就讀于加州大學(xué)伯克利分校,主修專業(yè)為物理以及數(shù)學(xué)和計算機科學(xué)。本科期間,他曾在 BAIR(伯克利人工智能研究實驗室)擔(dān)任研究助理。本科畢業(yè)后,他曾擔(dān)任機器人公司 Covariant AI 的創(chuàng)始工程師和研究科學(xué)家。
目前,關(guān)于 stealth 的信息不多。