圖片來(lái)源:Microsoft
Z Highlights
自由與好奇心是學(xué)術(shù)研究最寶貴的特質(zhì),正是對(duì)未知的執(zhí)著探索,才能孕育改變世界的創(chuàng)新。
計(jì)算機(jī)視覺(jué)領(lǐng)域正經(jīng)歷一場(chǎng)新的革命。Transformer、擴(kuò)散模型、神經(jīng)渲染等技術(shù)正將深度學(xué)習(xí)、計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺(jué)重新組合,這在重新定義機(jī)器如何理解和生成三維世界也即是我所稱(chēng)的空間智能(Spatial Intelligence)時(shí)代。
政策制定者對(duì)基礎(chǔ)科學(xué)研究項(xiàng)目保持戰(zhàn)略性的、長(zhǎng)期主義的投入很重要,不僅關(guān)乎知識(shí)邊界的突破,人才的積累與吸引,更是推動(dòng)社會(huì)進(jìn)步和保持創(chuàng)新生態(tài)系統(tǒng)健康發(fā)展的唯一途徑。
Fei-Fei Li,斯坦福大學(xué)首位紅杉講席教授,計(jì)算機(jī)科學(xué)教授,AI領(lǐng)域先鋒人物,尤其在計(jì)算機(jī)視覺(jué)領(lǐng)域具有開(kāi)創(chuàng)性貢獻(xiàn)。她是ImageNet項(xiàng)目的創(chuàng)始人之一,推動(dòng)了深度學(xué)習(xí)革命。近年來(lái),她積極倡導(dǎo)將人文價(jià)值融入人工智能技術(shù)發(fā)展,并在學(xué)術(shù)與創(chuàng)業(yè)領(lǐng)域持續(xù)探索Spatial Intelligence等前沿課題。本次訪談?dòng)蒚ools & Weapons與Fei-Fei Li回顧了她的個(gè)人經(jīng)歷,探討了受到政府與企業(yè)資助的學(xué)術(shù)研究如何在好奇心而非利益的驅(qū)動(dòng)下,帶來(lái)意想不到的變革,推動(dòng)突破性的創(chuàng)新和經(jīng)濟(jì)發(fā)展的機(jī)遇。
人生中最珍貴的禮物好奇心
BradSmith:今天我想和你談?wù)勔粋(gè)詞“好奇心”,它在你的生活、你的成功中所扮演了重要地角色,大家都認(rèn)為你一直是一個(gè)充滿(mǎn)好奇心的人。我想問(wèn)地是,這種“好奇心”最初是在哪里產(chǎn)生的?
Fei-Fei Li:作為科學(xué)家,我一直覺(jué)得好奇心是人生中最珍貴的饋贈(zèng)。我的書(shū)名是《The Worlds I See》,副標(biāo)題中的第一個(gè)詞就是“Curiosity”(好奇心),因?yàn)楸3趾闷娲_實(shí)是我人生中最重要的主線。
你問(wèn)我這種好奇心是如何誕生的,我認(rèn)為每個(gè)孩子生來(lái)都懷有好奇心。這種好奇心是我們?nèi)祟?lèi)獨(dú)有的天性,甚至在靈長(zhǎng)類(lèi)動(dòng)物和其他物種中也可以觀察到。這是一種推動(dòng)探索世界的本能。
我小時(shí)候很幸運(yùn),成長(zhǎng)環(huán)境保護(hù)了我的好奇心。我記得父親會(huì)在周末帶我去舊貨出售的攤位。雖然聽(tīng)起來(lái)像是無(wú)聊的事情,但對(duì)我來(lái)說(shuō),每一個(gè)攤位都像一個(gè)小型博物館。我父親會(huì)指著一個(gè)杯子說(shuō):“Fei-fei,看這個(gè)杯子上的貓頭鷹圖案!被蛘吣闷鹨粋(gè)園藝工具驚嘆它獨(dú)特的設(shè)計(jì)。這些瞬間讓我學(xué)會(huì)用全新的眼光看待世界。
早期移民生活的艱難與饋贈(zèng)
Brad Smith:你曾提到早年移民生活的艱難時(shí)期。能否分享一下你這段經(jīng)歷,以及它如何影響你的好奇心的成長(zhǎng)?
Fei-Fei Li:我15歲時(shí)和母親來(lái)到美國(guó),與父親在新澤西的帕西帕尼團(tuán)聚。我們的生活發(fā)生了劇變,從中國(guó)的中產(chǎn)階級(jí)家庭跌入美國(guó)的貧困階層。父母在一家干洗店工作,收入微薄。為了節(jié)省開(kāi)支,我們經(jīng)常去舊貨出售和車(chē)庫(kù)甩賣(mài)購(gòu)買(mǎi)日用品。
周末和父親一起去舊貨出售成為我童年中最珍貴的回憶之一。父親雖然不懂英語(yǔ),但總能用興奮的眼光發(fā)現(xiàn)那些不起眼物品的獨(dú)特之處。這種“初學(xué)者的心態(tài)”讓我明白,即使是最平凡的事物,也蘊(yùn)藏著值得探索的奧秘。那種對(duì)事物初次相遇的探索欲正是我后來(lái)作為科學(xué)家時(shí)所需的特質(zhì)。我當(dāng)時(shí)并沒(méi)有意識(shí)到這種視角是多么珍貴,這與科學(xué)家第一次看到一篇好論文、聽(tīng)說(shuō)一種新算法時(shí)的心情是一樣的。你必須時(shí)刻保持這種好奇心。
Brad Smith:你在普林斯頓的求學(xué)經(jīng)歷非常令人敬佩,尤其是在母親手術(shù)期間仍堅(jiān)持考試的故事。能否詳細(xì)講述這一經(jīng)歷?
Fei-Fei Li:這段經(jīng)歷對(duì)我來(lái)說(shuō)并不是悲情故事,而是移民的奮斗之歌。我的母親有很?chē)?yán)重的心臟病,在我普林斯頓大學(xué)大一期間需要進(jìn)行緊急手術(shù)。因?yàn)樗粫?huì)英語(yǔ),我必須充當(dāng)翻譯。手術(shù)期間她需要保持清醒并與醫(yī)生交流,而我必須一直在旁邊支持她。那時(shí)我正面臨期中考試,預(yù)設(shè)向?qū)W校申請(qǐng)了特殊安排,允許我在手術(shù)室旁邊穿著手術(shù)服完成考試。這段經(jīng)歷讓我更加堅(jiān)定無(wú)論環(huán)境多么艱難,都不能放棄上進(jìn)與學(xué)習(xí)。
在職業(yè)選擇的十字路口:選擇你所熱愛(ài)的!
Brad Smith:你在普林斯頓之后去了加州理工學(xué)院讀博士,但在攻讀博士期間,你曾面臨職業(yè)選擇的十字路口。一邊是McKinsey提供的高薪工作,另一邊是繼續(xù)科學(xué)研究的道路。你母親在這個(gè)決定中扮演了重要角色,能否分享這個(gè)故事?
Fei-Fei Li:那確實(shí)是我人生中非常艱難的時(shí)刻。博士期間的第二、第三年往往是最困難的階段。我曾經(jīng)的研究論文被拒絕,AI領(lǐng)域正處于“AI寒冬”時(shí)期,工業(yè)界尚未對(duì)AI產(chǎn)生廣泛興趣,學(xué)術(shù)崗位競(jìng)爭(zhēng)極其激烈。此外,我的家庭經(jīng)濟(jì)狀況依舊拮據(jù),母親的健康狀況也持續(xù)惡化。對(duì)于移民家庭而言,McKinsey的高薪工作代表著安穩(wěn)的未來(lái)。那時(shí)候,McKinsey的薪水比我父母在美國(guó)這么多年賺到的總和還要多。這讓我感到非常矛盾。我記得有一天在實(shí)驗(yàn)室里獨(dú)自思考,甚至開(kāi)始想象自己穿上西裝,拿著公文包,過(guò)著一份體面的職業(yè)生活。但我內(nèi)心深處始終難以割舍對(duì)科學(xué)的熱愛(ài)。
我打電話給母親,告訴她我在猶豫不決。她沒(méi)有考慮自己的健康狀況,沒(méi)有考慮我們的經(jīng)濟(jì)困境,而是堅(jiān)定地告訴我:“選擇你所熱愛(ài)的事情。你在猶豫什么?” 她的這番話讓我幡然醒悟?茖W(xué)讓我快樂(lè),好奇心讓我保持前行。她讓我意識(shí)到,人生最寶貴的禮物是能夠追隨自己的熱愛(ài)。而來(lái)自母親的愛(ài)和勇氣一直激勵(lì)著我。
ImageNet的誕生:對(duì)數(shù)據(jù)規(guī)模和多樣性的重要性的前瞻認(rèn)知
Brad Smith:你在2000年代初期創(chuàng)建了ImageNet,它后來(lái)成為深度學(xué)習(xí)革命的奠基石。你最初是如何產(chǎn)生這個(gè)想法的?
Fei-Fei Li:ImageNet始于2006年,當(dāng)時(shí)我注意到機(jī)器學(xué)習(xí)領(lǐng)域?qū)?shù)據(jù)的重視還遠(yuǎn)遠(yuǎn)不足。人們通常先開(kāi)發(fā)算法,然后隨便找一些數(shù)據(jù)來(lái)訓(xùn)練模型。但從數(shù)學(xué)角度來(lái)看,學(xué)習(xí)和泛化能力不僅依賴(lài)于算法架構(gòu),還依賴(lài)于數(shù)據(jù)的規(guī)模和多樣性。
當(dāng)時(shí)我讀了很多生物學(xué)和神經(jīng)科學(xué)的論文,了解到人類(lèi)的認(rèn)知系統(tǒng)需要大量的視覺(jué)輸入來(lái)學(xué)習(xí)和理解世界。我開(kāi)始思考,如果機(jī)器也需要類(lèi)似的視覺(jué)數(shù)據(jù)進(jìn)行學(xué)習(xí),那為什么我們不為AI構(gòu)建一個(gè)大規(guī)模的數(shù)據(jù)集?
ImageNet的想法在當(dāng)時(shí)被認(rèn)為是異想天開(kāi)。很多同行告訴我,收集那么多圖像既費(fèi)時(shí)又無(wú)意義,還可能影響我的學(xué)術(shù)生涯。但我始終堅(jiān)信,AI模型只有通過(guò)大量、多樣的數(shù)據(jù)才能真正學(xué)習(xí)世界的復(fù)雜性。于是我?guī)е鴥蓚(gè)學(xué)生開(kāi)始了ImageNet項(xiàng)目,花了三四年時(shí)間,最終創(chuàng)建了1500萬(wàn)張圖像、覆蓋2.2萬(wàn)個(gè)類(lèi)別的龐大數(shù)據(jù)集。它是人工智能領(lǐng)域有史以來(lái)最大的數(shù)據(jù)集,也成為了深度學(xué)習(xí)革命的關(guān)鍵數(shù)據(jù)集,為神經(jīng)網(wǎng)絡(luò)算法提供了豐富的訓(xùn)練數(shù)據(jù)。
ImageNet的意義不僅僅在于圖像數(shù)量或其作為視覺(jué)數(shù)據(jù)集的形式,更在于它引入了大數(shù)據(jù)概念。如今,如果想要推動(dòng)人工智能的發(fā)展,必須依賴(lài)三大要素:GPU、算法和數(shù)據(jù)。從AlphaFold到ChatGPT,再到Gemini和Transformer等最新的人工智能模型和產(chǎn)品,均建立在這三大要素的基礎(chǔ)之上。
獨(dú)立、自由、基于好奇心的學(xué)術(shù)研究的價(jià)值
Brad Smith:你對(duì)學(xué)術(shù)研究始終充滿(mǎn)熱情。為什么你認(rèn)為學(xué)術(shù)研究對(duì)計(jì)算機(jī)科學(xué)如此重要?
Fei-Fei Li:我始終相信學(xué)術(shù)研究的核心在于自由和好奇心,“curiosity based research”(基于好奇心的研究)才能做得最好。在很大程度上,學(xué)術(shù)研究最寶貴的特質(zhì)是自由。作為大學(xué)教授,沒(méi)有人會(huì)告訴你應(yīng)該研究什么。你可以完全基于好奇心選擇課題,哪怕這個(gè)課題在當(dāng)時(shí)看來(lái)毫無(wú)商業(yè)價(jià)值。換言之,美國(guó)的創(chuàng)新創(chuàng)業(yè)環(huán)境為研究人員提供了獨(dú)立探索未知領(lǐng)域的空間,不受商業(yè)目標(biāo)的限制。
ImageNet的誕生恰恰是這種自由環(huán)境的產(chǎn)物。當(dāng)時(shí)許多人不看好這個(gè)項(xiàng)目,甚至質(zhì)疑它的意義,但我依然堅(jiān)持。正是因?yàn)檫@種學(xué)術(shù)科研上的自由,研究人員才能想象、實(shí)踐不可想象、不可實(shí)踐的事物,并最終改變世界。學(xué)術(shù)界是一個(gè)肥沃的樂(lè)園,在這里,研究人員和學(xué)生可以盡情想象匪夷所思的事情,或者想象一些讓人嗤之以鼻的事情。
我認(rèn)為,美國(guó)有著非常獨(dú)特且珍貴的科技創(chuàng)新生態(tài)系統(tǒng),而大學(xué)(學(xué)術(shù)機(jī)構(gòu))和公共部門(mén)(政府)在其中扮演著關(guān)鍵角色。學(xué)術(shù)機(jī)構(gòu)不僅是技術(shù)創(chuàng)新的搖籃,還肩負(fù)著培養(yǎng)下一代科學(xué)家和工程師的責(zé)任。我們的實(shí)驗(yàn)室里有很多年輕的學(xué)生,他們帶著無(wú)限的創(chuàng)造力和激情,讓我對(duì)未來(lái)充滿(mǎn)信心。而這正是我熱愛(ài)美國(guó)科技創(chuàng)新生態(tài)系統(tǒng)的原因它開(kāi)放且流動(dòng),知識(shí)與技術(shù)在學(xué)術(shù)界、產(chǎn)業(yè)界和年輕一代之間快速流動(dòng),打破了傳統(tǒng)的邊界。
World Labs與Spatial Intelligence
Brad Smith:你既是一名學(xué)者,也是一名企業(yè)家。能否介紹一下你目前專(zhuān)注的創(chuàng)業(yè)項(xiàng)目和理解呢?
Fei-Fei Li:在2023年休假期間,我意識(shí)到計(jì)算機(jī)視覺(jué)領(lǐng)域正經(jīng)歷一場(chǎng)新的革命。Transformer、擴(kuò)散模型、神經(jīng)渲染等技術(shù)正將深度學(xué)習(xí)、計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺(jué)重新組合,這在重新定義機(jī)器如何理解和生成三維世界也即是我所稱(chēng)的空間智能(Spatial Intelligence)時(shí)代?臻g智能是一項(xiàng)基礎(chǔ)技術(shù),能夠理解并生成三維世界,帶來(lái)前所未有的交互體驗(yàn)。
然而,單靠學(xué)術(shù)界的資源很難推動(dòng)這個(gè)領(lǐng)域的快速發(fā)展。數(shù)據(jù)、算力和跨學(xué)科協(xié)作都需要大量資金和團(tuán)隊(duì)力量。因此,我與前學(xué)生及行業(yè)同事共同創(chuàng)建了World Labs,致力于開(kāi)發(fā)世界模型,幫助用戶(hù)創(chuàng)造、交互并利用三維世界,釋放生產(chǎn)力與創(chuàng)造力。
Brad Smith:美國(guó)的國(guó)家科學(xué)基金會(huì)或其他聯(lián)邦基金,企業(yè)社會(huì)基金在您的事業(yè)發(fā)展和研究過(guò)程中發(fā)揮了什么作用?
Fei-Fei Li:至關(guān)重要的作用。國(guó)家科學(xué)基金會(huì)是我早期研究的重要資助來(lái)源之一,另一個(gè)主要資助機(jī)構(gòu)是海軍研究辦公室(ONR)。ONR在計(jì)算機(jī)科學(xué)和計(jì)算機(jī)視覺(jué)領(lǐng)域尤為知名,他們通過(guò)多大學(xué)研究計(jì)劃(MURI)資助來(lái)自不同大學(xué)的教授,推動(dòng)跨學(xué)科與跨機(jī)構(gòu)合作。我職業(yè)生涯中參與了許多MURI項(xiàng)目,這些項(xiàng)目極大地促進(jìn)了領(lǐng)域內(nèi)的科技創(chuàng)新。
此外,產(chǎn)業(yè)界在推動(dòng)科研方面的作用也日益重要。事實(shí)上,20年前,我的第一筆產(chǎn)業(yè)資助來(lái)自微軟,后來(lái)陸續(xù)獲得了來(lái)自谷歌、亞馬遜、松下、豐田、英偉達(dá)等企業(yè)的支持。聯(lián)邦資助與企業(yè)資助的良性互動(dòng),共同構(gòu)建了美國(guó)獨(dú)特的、極具優(yōu)勢(shì)的創(chuàng)新創(chuàng)業(yè)生態(tài)系統(tǒng)。
Brad Smith:你對(duì)政策制定者在支持基礎(chǔ)研究方面有什么建議?
Fei-FeiLi:過(guò)去五年,我越來(lái)越積極地倡導(dǎo)為公共部門(mén)的研究與技術(shù)提供資源支持。正如我的經(jīng)歷所示,公共部門(mén)資助對(duì)創(chuàng)新生態(tài)系統(tǒng)至關(guān)重要。大學(xué)不僅是技術(shù)創(chuàng)新的發(fā)源地,也是培養(yǎng)人才和促進(jìn)關(guān)于技術(shù)變革的廣泛、嚴(yán)謹(jǐn)討論的場(chǎng)所。我希望政策制定者將公共部門(mén)和學(xué)術(shù)界視為戰(zhàn)略性資產(chǎn),對(duì)其進(jìn)行長(zhǎng)期投入。這種戰(zhàn)略性的、長(zhǎng)期主義的投入不僅關(guān)乎知識(shí)的突破,人才的積累與吸引,更是推動(dòng)美國(guó)社會(huì)進(jìn)步和保持創(chuàng)新生態(tài)系統(tǒng)健康發(fā)展的唯一途徑。
原視頻:Fei-Fei Li: Staying curious at the forefront of AI
https://www.youtube.com/watch?v=WX7mTMXTuy4&t=796s&ab_channel=Microsoft
編譯:YIBING
請(qǐng)注意,本文編譯自文末載明的原始鏈接,不代表Z Potentials立場(chǎng)。如果您對(duì)本文有任何想法或見(jiàn)解,歡迎在評(píng)論區(qū)留言互動(dòng)探討。