1月20日至24日,世界經(jīng)濟(jì)論壇2025年年會在瑞士達(dá)沃斯-克洛斯特斯舉行。在這場匯聚全球政商領(lǐng)袖的重要會議上,AI 技術(shù)的發(fā)展前景成為最受關(guān)注的話題之一。昨天,華爾街日報對 Anthropic 首席執(zhí)行官 Dario Amodei 進(jìn)行了一場深度對話,這位 AI 行業(yè)領(lǐng)軍企業(yè)的掌舵人首次明確預(yù)測,AI 系統(tǒng)可能在 2027 年前后在"很多方面"超越人類能力。
作為 Claude(一個與 ChatGPT 齊名的大語言模型)的締造者,Amodei 不僅詳細(xì)闡述了這一大膽預(yù)測背后的思考,還就 AI 發(fā)展將如何重塑經(jīng)濟(jì)結(jié)構(gòu)、改變就業(yè)形態(tài),以及企業(yè)和政府該如何應(yīng)對這一變革等關(guān)鍵問題,提供了深入見解。這番言論在達(dá)沃斯引發(fā)廣泛討論,也為我們勾勒出了一幅加速到來的 AI 時代圖景。
本文整理了這場重要對話的完整內(nèi)容,了解這場即將改變?nèi)祟惿鐣募夹g(shù)革命。
文稿整理:主持人 : 首先,我要表達(dá)由衷的感謝。我利用 Claude 開發(fā)了一個達(dá)沃斯助手,這確實讓我的管理層都應(yīng)該感激不盡。它不受時差影響,無需支付住宿費(fèi)用,而且對我的工作幫助頗多。這個助手已經(jīng)整合了我的日程安排、筆記等各項功能。不過,它仍有一些需要改進(jìn)的地方,我想就產(chǎn)品相關(guān)問題進(jìn)行探討。在開始之前,我想了解一下在座的各位,有多少人使用過 Claude?是否有深度用戶?很好,看來這將是一場適合所有人參與的精彩對話。我想先列舉一些我期待的功能,這會是一個有趣的討論。您可以選擇是否透露具體時間表,也可以告知某項功能是否會實現(xiàn)。那么首先,關(guān)于網(wǎng)絡(luò)訪問功能,您怎么看?
Dario Amodei: 這確實是我們正在研究的重點領(lǐng)域之一,且將在不久的將來推出。需要說明的是,Anthropic 的業(yè)務(wù)主要面向企業(yè)客戶,因此我們往往優(yōu)先處理企業(yè)端需求。網(wǎng)絡(luò)訪問功能更偏向消費(fèi)者端,但我們已經(jīng)在這方面投入了相當(dāng)時間,且形成了一些有別于其他模型提供商的獨(dú)特思路。雖然我不便提供具體上線時間,但這項功能即將推出。我們深知這對消費(fèi)者,尤其是深度用戶的重要性,因此也將其列為優(yōu)先開發(fā)項目。
談Claude AI 新功能主持人 : 非常好。關(guān)于語音模式即實現(xiàn)與 Claude 的語音對話功能。
Dario Amodei: 這項功能最終也會實現(xiàn)。目前的情況是,Claude 已經(jīng)具備語音轉(zhuǎn)文字和文字轉(zhuǎn)語音的能力。至于雙向語音交互模式,這是我們未來規(guī)劃中的一項內(nèi)容。不過從企業(yè)用戶和部分深度用戶的角度來看,對這項功能的需求相對較低,但它確實會在未來推出。
主持人 : 那么關(guān)于照片生成功能呢?
Dario Amodei: 我傾向于將圖像或視頻生成與其他生成式 AI 功能區(qū)分對待。從人類的角度來看:人類能夠接收音頻、照片、視頻信息,但并不具備直接"生成"照片的能力。當(dāng)然,畫家可以創(chuàng)作,但照片制作是另一回事。我認(rèn)為這是個較為特殊的領(lǐng)域。從安全和風(fēng)險控制的角度來看,圖像和視頻生成面臨著一系列獨(dú)特的挑戰(zhàn),這與文本生成有著本質(zhì)區(qū)別。另外,企業(yè)用戶對這類功能的需求也相對較低。因此,這并非我們的優(yōu)先發(fā)展方向。如果未來消費(fèi)端對此需求激增,我們可能會選擇與專業(yè)的圖像生成公司展開合作。
主持人 : 理解。我在推特(或者 X,現(xiàn)在該如何稱呼它)上進(jìn)行了相關(guān)調(diào)研,收到了 200 條回復(fù)。實際上,我提出的所有問題都獲得了大約 200 條回復(fù),其中絕大多數(shù)都在要求提高使用頻率上限。
Dario Amoei: 確實,我們在這方面正在積極努力。過去一年,特別是最近三個月,需求的快速增長已經(jīng)超出了我們現(xiàn)有的計算資源承載能力。大規(guī)模采購計算資源需要充分的準(zhǔn)備和完善的采購流程。我們的營收在過去一年增長了約 10 倍,雖然具體數(shù)字不便透露,但規(guī)模已從億美元級別躍升至百億美元級別,且增長勢頭仍在持續(xù)。我們正在全力提升效率,同時也在推進(jìn)與亞馬遜在 ReInvent 大會上達(dá)成的合作,計劃建設(shè)一個包含數(shù)十萬顆 Trannium 2 芯片的集群。預(yù)計到 2026 年,擁有超過百萬顆芯片也并非不可能。我們正加緊部署這些芯片,并致力于優(yōu)化推理效率,但這需要一定時間。面對如此快速增長的需求,我們正竭盡全力滿足用戶需求,并持續(xù)改善付費(fèi)用戶的使用體驗。
主持人: 好的,我會記住您的承諾。還有一個問題是關(guān)于記憶功能,希望 Claude 不僅能夠記住單個項目中的對話,還能夠?qū)崿F(xiàn)跨項目的內(nèi)容記憶。
Dario Amodei: 這確實是一個重要議題。這也是我們更宏大愿景"虛擬協(xié)作者"概念的重要組成部分。就像與同事交談時,對方需要記住之前的對話內(nèi)容一樣,這項功能也將很快推出。你之前提到我們非常注重企業(yè)客戶,但作為消費(fèi)者,即便在企業(yè)工作的我們也都是消費(fèi)者。
主持人 : Claude 獨(dú)特的角色特性使其極具吸引力,也是它如此實用的原因之一,這也是為什么在面對其他大型語言模型或產(chǎn)品時,我依然會選擇 Claude。您能談?wù)?Claude 的"角色"設(shè)計理念嗎?顯然你們?yōu)槠湓O(shè)計了適應(yīng)企業(yè)環(huán)境的形象,那么在消費(fèi)端是如何考慮的?
Dario Amodei: 實際上,Claude 的角色定位在企業(yè)端和消費(fèi)端都同樣重要,因為與消費(fèi)者的互動至關(guān)重要,對企業(yè)也是如此。我們服務(wù)的企業(yè)客戶中,如 Intercom 等眾多客服公司都在使用我們的模型提供客戶服務(wù),這使得交互模式變得尤為重要。即便在編程等專業(yè)場景中,角色定位依然不可或缺。斯坦福醫(yī)學(xué)院最近的一項研究將 Claude 與其他模型在醫(yī)療場景下進(jìn)行對比,包括放射科影像分析的準(zhǔn)確度以及醫(yī)生采納模型建議的程度。研究發(fā)現(xiàn)醫(yī)生更傾向于接受 Claude 的建議,采納度也更高。我認(rèn)為這與模型的交互方式密切相關(guān)。因此,無論是企業(yè)還是消費(fèi)者,我們都投入了大量精力,致力于打造不僅優(yōu)質(zhì)而且真實且有價值的 Claude 互動體驗。我們?nèi)绱酥匾曔@一點,還有一個更深層的原因:當(dāng)今的個人用戶,尤其是在提升生產(chǎn)力方面,每天都會花費(fèi)數(shù)小時與模型交互,將其視為助手。在工作中,這些智能助手有時甚至能比人更好地解決數(shù)學(xué)問題。在如此頻繁的交互中,我們必須確保做對每一個細(xì)節(jié)。這不僅是要讓模型顯得親和、富有吸引力,更要確保模型與用戶的互動方式能讓使用者在數(shù)月乃至數(shù)年后,在將其整合入工作流程后,真正受益。用戶會變得更高效,學(xué)到新知識。模型固然會幫助完成工作、提升效率,但從長遠(yuǎn)來看,這種關(guān)系必須是互惠互利的。
回顧社交媒體的發(fā)展歷程,其中存在諸多問題。最顯著的問題在于,盡管社交媒體極具吸引力,能帶來即時的多巴胺刺激,但我們都對其長期使用對人們的健康影響持懷疑態(tài)度。我們從中吸取了教訓(xùn),致力于確保 AI 不會重蹈覆轍。而 Claude 的角色定位正是這一努力中最關(guān)鍵的環(huán)節(jié)之一。
談2027年AI超過人類主持人 : 確實如此。您提到了模型,這也是我在 X 平臺上收到的眾多反饋之一。現(xiàn)場也有很多深度用戶,他們對下一代模型充滿期待。OpenAI 最近推出了新的推理模型,如 o1、o3。貴公司在這方面有什么計劃?
Dario Amodei: 是的,我們將在不久的將來推出一些非常出色的模型。具體名稱暫時不便透露。關(guān)于您提到的推理模型,我們的觀點與他們略有不同。外界通常將推理模型和測試時計算分為兩類:常規(guī)模型和推理模型,仿佛是兩條截然不同的技術(shù)路徑。但我們的視角不同。我們更傾向于將其視為一個連續(xù)譜:模型具備思考和反思自身思考的能力,最終得出結(jié)果。如果您使用過 Sonnet 3.5,就會發(fā)現(xiàn)它在某些方面已經(jīng)展現(xiàn)出這種特性。
我認(rèn)為我們即將看到的變革是在大規(guī)模應(yīng)用強(qiáng)化學(xué)習(xí)。當(dāng)使用強(qiáng)化學(xué)習(xí)訓(xùn)練模型時,它會開始進(jìn)行更多的思考和反思。這并非如同所謂的"推理模型"或"測試時計算"人們用各種術(shù)語描述那樣是一種全新方法。更像是一種涌現(xiàn)特性,是在更大規(guī)模、基于結(jié)果的方式上訓(xùn)練模型后自然形成的產(chǎn)物。我認(rèn)為這將帶來一些改變當(dāng)然,具體的運(yùn)作和實現(xiàn)方式還有待觀察但我預(yù)計會出現(xiàn)一種更連續(xù)的差值形態(tài),更自然地將推理與模型的其他功能結(jié)合起來。我認(rèn)為這才是最有效的方法。正如你提到的,我們一直致力于讓模型的使用體驗非常流暢,使用戶能充分發(fā)揮其潛力。你會看到,我們對推理模型持類似觀點,也許會采取一種......我們會有一種獨(dú)特的風(fēng)格,可能會在推理模型領(lǐng)域做一些與他人不同的嘗試。
主持人 : 我想稍微回到前面的話題,因為您剛才提到......也許我該在此打住,免得您又不給出具體時間表。
Dario Amodei: 是的,我不會給出任何確切日期。無論是這件事,還是我在本次活動中提到的任何其他事項,都不會給出具體時間表。
主持人 : 好的,不要具體日期。但我們聽到了"不久的將來"這個說法。在您看來,這是指 6 個月?還是 3 個月?大約在 3 到 6 個月之間,對嗎?如果我們把視角放得更寬廣一些,最近有很多關(guān)于這個領(lǐng)域發(fā)展速度的討論。比如本周就有報道稱 OpenAI 已經(jīng)開發(fā)出了博士水平的代理系統(tǒng)。發(fā)展真的有這么快嗎?
Dario Amodei: 是的,談到我對這個發(fā)展速度的個人感受,包括認(rèn)知和情感層面的歷程:回溯到 2018 年、2017 年,也就是我進(jìn)入這個領(lǐng)域幾年后,當(dāng)時我和 Anthropic 的幾位聯(lián)合創(chuàng)始人是最早記錄"擴(kuò)展性規(guī)律"的研究者之一。這些規(guī)律表明,當(dāng)你為這些模型投入更多算力時,它們在各個方面都會變得更優(yōu)秀。從那時起直到約 6 個月前,我一直認(rèn)為:基于這些趨勢,我們將獲得在幾乎所有任務(wù)上都優(yōu)于人類的模型。我推測這可能發(fā)生在 2020 年代某個時間點,可能是二十年代中期,但我一直強(qiáng)調(diào):我并不確定。因為我們可能會犯錯,我認(rèn)為保持這種態(tài)度是恰當(dāng)?shù)。特別是作為這類公司的 CEO,如果總是信誓旦旦地說:"這一定會發(fā)生,一切都會很完美......",聽起來就像在炒作,對吧?所以在大約 3 到 6 個月前,我對此還存在很大的不確定性,F(xiàn)在我仍有疑慮,但不確定性已經(jīng)大大降低。我認(rèn)為在未來兩三年內(nèi),我們確實會看到這樣的模型出現(xiàn)在工作場所和消費(fèi)者手中。它們?nèi)詫⒆鳛槿祟惖闹执嬖,但會逐步在幾乎所有方面超越人類。這將帶來巨大的積極影響,當(dāng)然我們也需要關(guān)注潛在的負(fù)面影響。我確實認(rèn)為進(jìn)展速度與普遍預(yù)期相符。
我想批評的一點是,既然快速進(jìn)展的可能性如此之大,我們就應(yīng)該以應(yīng)有的嚴(yán)肅態(tài)度對待并討論它。有些公司我就不具體點名了經(jīng)常出現(xiàn)一些奇怪的推特傳言,比如有員工暗示性地表示,好像在暗示"嘿,我們這里正在進(jìn)行一些驚人的研究"。我認(rèn)為這是危險的,因為對外界而言,這看起來就像是在炒作。這種傳播方式會讓人覺得這項技術(shù)不夠可信,而實際上它確實十分嚴(yán)肅且重要。所以當(dāng)事情確實很嚴(yán)肅時,這種"似乎在夸大其詞"的做法實在危險。我認(rèn)為整個 AI 產(chǎn)業(yè)都有責(zé)任表明我們所處時刻的嚴(yán)峻性。如果我們真的認(rèn)為一些極其積極的變革即將發(fā)生,而如此重大的變革必然伴隨著風(fēng)險,那么我們就有責(zé)任以嚴(yán)謹(jǐn)?shù)膽B(tài)度進(jìn)行溝通,表達(dá)我們真實的觀點。
談agents的具體功能主持人 : 我很想了解您所說的那些風(fēng)險以及您期待的規(guī)則和監(jiān)管措施。但在此之前,讓我們回到您提到的"同事"這個話題。在達(dá)沃斯,討論都圍繞著"agents"展開,簡直可以稱之為"代理大狂歡",各方都在宣稱自己的代理即將面世。您稱之為"虛擬協(xié)作者",這是一個獨(dú)特的稱謂,對嗎?您們在代理或虛擬協(xié)作者方面的進(jìn)展如何?我們在去年底已經(jīng)看到一些跡象,比如你們在"使用計算機(jī)"方面的嘗試。能否為我們介紹一下大致的發(fā)展路線?當(dāng)然,我知道您不愿談具體日期,但今年我們會看到什么?作為這個領(lǐng)域的領(lǐng)軍企業(yè)之一,也許您能幫我們先理清這個問題。
Dario Amodei: 首先,我想厘清一點,"agents"這個詞,以及類似的術(shù)語如 AGI、ASI、reasoning(推理)等,在我們領(lǐng)域經(jīng)常使用,但實際上都沒有嚴(yán)格的技術(shù)定義。外行可能認(rèn)為這些詞有明確含義,但事實并非如此。"agents"這個詞,有時可能僅指"升級版的 Clippy";也可能指我激活這個 AI 系統(tǒng)后,它就能為我編寫完整的應(yīng)用程序,甚至創(chuàng)建一家公司。我們的設(shè)想更接近后者,這就是我們所說的"虛擬協(xié)作者"。你提到的"使用計算機(jī)"功能,可能是這方面的早期實踐之一。這只是其中一個組成部分,但我們的構(gòu)想是,它可以作為工作助手,也可以是個人助手一個能在計算機(jī)屏幕上完成任何類似虛擬人能做事情的模型。你可以與它對話,分配任務(wù),這個任務(wù)可能持續(xù)一整天。比如,你說"我們需要實現(xiàn)這個產(chǎn)品功能",它就會編寫代碼、測試代碼、將代碼部署到測試環(huán)境,與同事溝通,撰寫設(shè)計文檔,編寫 Google 文檔,通過 Slack 或郵件與他人聯(lián)系。就像一個真實的人一樣,它會完成這些工作,然后定期向您匯報進(jìn)度。因此,我將其視為一個代理,一個自主的虛擬協(xié)作者,它在較長時間范圍內(nèi)代表您行動,而你只需要偶爾檢查和指導(dǎo)。你可以將其想象為在虛擬環(huán)境中擁有一個人的全部輸入和輸出能力的通道。
主持人 : 關(guān)于時間表,正如您所說,研究過程本身充滿不確定性,很難做出絕對的預(yù)測。我無法確切預(yù)知我們或整個行業(yè)的發(fā)展方向。但我"推測"(這不是承諾)我們今年就會看到非常強(qiáng)大的相關(guān)功能出現(xiàn),可能在上半年就能見到。那么我們來談?wù)?quot;房間里的大象",也就是代理對人類工作的影響,對嗎?您剛才描述的很多工作場景,目前都是由人來完成的。
Dario Amodei: 是的,我通常從短期和長期兩個維度來看待這個問題。短期我們過去也經(jīng)歷過技術(shù)對勞動力的沖擊。在我看來,短期是指一到兩年,可能延伸到三年。在這個時間范圍內(nèi),雖然我們沒有完美的解決方案,但我們已經(jīng)多次見證了技術(shù)替代勞動力的沖擊。我認(rèn)為短期內(nèi)應(yīng)該從工人適應(yīng)性的角度思考,利用比較優(yōu)勢。比較優(yōu)勢這一理論很精妙即使機(jī)器能完成你 90% 的工作,剩下的 10% 反而變得極其珍貴。你會將全部精力投入到那 10% 中,做出十倍于以前的成果,你的產(chǎn)出也隨之增加十倍,因為另外 90% 由機(jī)器承擔(dān)。這對人類可能是有利的。你也可以學(xué)習(xí)如何調(diào)整自己的努力,以配合機(jī)器完成的部分。另一方面,從產(chǎn)品設(shè)計的角度,我們也可以努力使產(chǎn)品傾向于"互補(bǔ)"而非"替代"。
經(jīng)濟(jì)學(xué)家 Erik Brynjolfsson 約一年前的研究很有趣,他指出企業(yè)在部署 AI 時通常會采用替代模式;但如果投入更多思考,就會發(fā)現(xiàn)可以采用互補(bǔ)模式,而且這樣做時生產(chǎn)力提升更顯著。這表明技術(shù)部署方式存在路徑依賴性。對我們而言,在設(shè)計這種"虛擬協(xié)作者"時,也在思考如何實現(xiàn)互補(bǔ)而非簡單替代。當(dāng)然,我不會回避現(xiàn)實,這是一個競爭激烈的市場。如果互補(bǔ)模式總是被純粹的替代模式擊敗,整個行業(yè)就會陷入困境,我們也需要找到解決方案。市場力量確實強(qiáng)大,但我認(rèn)為仍有機(jī)會找到一條既符合市場規(guī)律,又能推動整個產(chǎn)業(yè)鏈向更好、更具創(chuàng)新性、更人性化方向發(fā)展的道路。這是短期的情況。從長期來看,我非常確信雖然不確定具體時間,可能是 2027 年,也可能稍晚,但我認(rèn)為不會晚太多 AI 系統(tǒng)將在幾乎所有方面超越人類,至少會超過絕大多數(shù)人在幾乎所有領(lǐng)域的能力,最終甚至?xí)剿腥嗽谒蓄I(lǐng)域的水平。機(jī)器人也將受益于更先進(jìn)的 AI 系統(tǒng),我們會逐步研發(fā)出更優(yōu)秀的機(jī)器人。到那時,我們需要在這樣的場合,比如在達(dá)沃斯這樣的活動中,認(rèn)真討論:"我們該如何組織經(jīng)濟(jì)?""人類要如何找到自我價值?"很多基于"人類是地球上最智慧物種"這一前提的假設(shè),都將被 AI 的發(fā)展打破。
唯一的好消息可能是我們會"同舟共濟(jì)"。實際上,我更擔(dān)心出現(xiàn) AI 完全替代 30% 勞動力,而另外 70% 尚未被替代的情況。這會引發(fā)嚴(yán)重的階級沖突,被替代者和未被替代者之間的對立將十分尖銳。如果我們都在同一條船上,雖然也不一定會好過,但我認(rèn)為情況會稍好一些,因為我們會坐下來討論:"這并非隨機(jī)挑選三成人說你已經(jīng)沒用了",而是我們所有人都面臨相同的處境。我們需要直面這樣一個問題:當(dāng)人類社會發(fā)展到這樣的技術(shù)水平,擁有了極大的富足和價值,但"通過人類經(jīng)濟(jì)勞動來分配價值并在勞動中獲得自我價值感"這種模式已不再適用時,我們該怎么辦?這確實是我深信會發(fā)生的事,我不會回避這一點。AI 企業(yè)很可能會處于這場風(fēng)暴的中心,或者說是眾矢之的。我們需要對此給出一個負(fù)責(zé)任的答案。
談AI人才的重要性主持人 : 是的,我正想問這個問題。您談到了重新組織經(jīng)濟(jì)等內(nèi)容。不過目前,您們這個行業(yè)內(nèi)部正處于一場人才爭奪戰(zhàn),是嗎?OpenAI、Meta 以及其他競爭對手都在積極招攬人才。你們是如何考慮為 Anthropic 吸引最優(yōu)秀的人才的?
Dario Amodei: 是的,我想從兩個方面來說明。首先,我在一些播客中也提到過,我對人才的理念是"人才密度"遠(yuǎn)比"人才規(guī)模"重要。
主持人 : 也就是說,您希望團(tuán)隊規(guī)模相對較小但都是極其優(yōu)秀的人才...
Dario Amodei: 即使有些公司的規(guī)模是我們的 10 倍,擁有的優(yōu)秀人才數(shù)量也比我們多一倍,但當(dāng)這些優(yōu)秀人才相互協(xié)作時,總會產(chǎn)生一種獨(dú)特的化學(xué)反應(yīng)。當(dāng)你雇用一位工程師或研究員時,他環(huán)顧四周,發(fā)現(xiàn)其他所有人都和他一樣才華橫溢。這一直是我們的理念所在,我認(rèn)為這也是優(yōu)秀人才選擇 Anthropic 的原因。第二點是我們的價值觀,以及我們對這些價值觀的真誠表達(dá)。從一開始,認(rèn)真對待安全和社會影響這些問題就對我們而言至關(guān)重要。誠然,確實有幾家公司公開表示他們很重視這些議題,也確實做出了一些具體努力,對此我表示贊賞。但隨著時間推移,我和我的聯(lián)合創(chuàng)始人離開了原來的雇主,選擇了我們自己的方式,而他們也有他們的做法,其他公司也有其他的方式。這些差異逐漸顯現(xiàn)出來。你能看到公司們做出承諾,也能看到這些承諾最終的落實情況。你也能從他們內(nèi)部員工對這些承諾的態(tài)度中看出端倪有些事情雖然不會公開,但你能從他們的行動或"用腳投票"的方式看出來。我認(rèn)為這一點非常重要,真正踐行這些價值觀,讓它們成為實質(zhì)內(nèi)涵而不是營銷噱頭,是至關(guān)重要的。多家公司的內(nèi)部人才也能分辨出誰是真正在踐行,誰只是在說說而已。我認(rèn)為人才最終的流向我是個樂觀主義者或許能體現(xiàn)誰是真正認(rèn)真在做的。
主持人 : 我們時間不多了,但我還有很多想討論的內(nèi)容。我還是想談一下監(jiān)管問題。另外,我注意到你昨天沒有出席那個就職儀式...那么您對這個問題是怎么看的呢?
Dario Amodei: 我是這樣認(rèn)為的:Anthropic 與其他一些參與者略有不同。我經(jīng)常這樣表述,Anthropic 是一個"政策參與者",而不是一個"政治參與者"。政治參與者會考慮:"我會受到哪些政治力量的影響?我要如何確保我想做的事不會被反壟斷法案阻礙,或不會被某些法規(guī)限制?"這是他們的思維方式。而我們更關(guān)注的是全球 AI 產(chǎn)業(yè)格局,并且有自己的一套看法和政策主張。也許某一天我們會正式發(fā)布一份政策綱領(lǐng),闡述我們認(rèn)為應(yīng)該采取的措施。例如:如何應(yīng)對中國并保持領(lǐng)先優(yōu)勢;如何通過適當(dāng)?shù)臏y試與評估來應(yīng)對我們自己的 AI 系統(tǒng)可能帶來的風(fēng)險;以及我們之前討論的一些經(jīng)濟(jì)問題。
我們的立場是:我們對這些議題有自己的觀點,我們會向任何愿意傾聽的人解釋這套立場。我們會與拜登政府溝通我們的看法,也會與特朗普政府溝通,比如在對華問題上。我曾與馬特波廷杰(Matt Pottinger)一起撰寫過一篇專欄文章,他曾是第一屆特朗普政府的副國家安全顧問。這么做就是想表明,在政治派別的不同區(qū)間以及整個行業(yè)內(nèi),像出口管制這樣的問題實際上存在共同利益。因此,您會看到 Anthropic 并不急于對任何一方表示效忠。Anthropic 有一套我們認(rèn)為"如果每個人都了解實際情況就應(yīng)該獲得兩黨支持"的政策立場,因為這些議題本身極其重要且關(guān)鍵。某些政治人物可能對這些立場支持程度有所不同,但這對我們來說并不重要。我們會與所有人溝通我們的政策主張,因為如果這個問題處理不當(dāng),社會就會走向不好的方向。而且遲早...如果我們錯了,那么我們的政策主張就不成立;但如果我們是對的,那么再過兩三年就會明顯顯現(xiàn)出來。
比如,也許確實需要某些針對勞動力的經(jīng)濟(jì)政策;也許我們確實需要對模型進(jìn)行安全風(fēng)險的測試和評估;也許,就像即將卸任的國家安全顧問杰克沙利文所說,我們在對華競爭中必須保持領(lǐng)先,這也是出臺某些出口管制措施的原因。如果這些判斷是正確的,那么歷史會證明我們是對的,而且會很快得到證明,比如在本屆總統(tǒng)任期內(nèi)。所以我們的做法就是:向所有人傳達(dá)我們認(rèn)為正確的政策,并逐步使其公開化。無論人們的意識形態(tài)如何,無論他們現(xiàn)在支持或反對什么,只要我們是對的這是關(guān)鍵那么一兩年后就會顯現(xiàn)出來,屆時大家會發(fā)現(xiàn)我們站在了正確的歷史一邊。這就是我對政策的思考方式。
主持人 : 那您對今早推翻行政命令的決定有何看法?
Dario Amodei: 說實話,那道行政命令實際上并沒有做太多事情。它更像是一個起點。我們總體上是支持的,因為它要求在訓(xùn)練大型模型時需要提交信息報告,我認(rèn)為這很合理。國家安全系統(tǒng)應(yīng)該了解各公司的具體工作。這對我們來說也沒有造成太大負(fù)擔(dān),對 Anthropic 而言大約只需要一兩個工作日的時間。它也不是什么復(fù)雜的監(jiān)管方案,實際上它根本不是一個完整的監(jiān)管體系。所以總的來說,我支持這個行政命令,但它的影響相對有限,只是一個小規(guī)模的嘗試。
對我而言,更重要的措施有兩點:首先是對華出口管制以及防止芯片走私。這也是我和波廷杰在專欄文章中討論的重點。我認(rèn)為這(對華出口管制)是至關(guān)重要的存在性問題。我們才剛剛開始看到這些模型對軍事情報的價值。從應(yīng)對自身模型風(fēng)險的角度來看,在與中國的競爭中保持領(lǐng)先盡管這越來越困難實際上能為我們爭取緩沖時間。如果我們沒有保持領(lǐng)先,就會在這場國際競賽中陷入兩難境地:"如果我們?yōu)榱私档妥约耗P偷娘L(fēng)險而放慢 3 個月,中國就會趕上。"我們不希望陷入這種處境。此外,我認(rèn)為內(nèi)部測試和評估也很重要。我們與一些 AISIs 機(jī)構(gòu)合作進(jìn)行了內(nèi)部測試和評估。我認(rèn)為這些工作至關(guān)重要,而且我們看到兩黨都支持在新一屆政府中繼續(xù)保留這些工作。這些主要是對模型的國家安全風(fēng)險進(jìn)行測試,這應(yīng)該是一個能獲得兩黨支持的議題。不過也出現(xiàn)了一些誤解,比如有人認(rèn)為這種測試與多元化公平(DEI)有關(guān),但實際并非如此。這些 AISIs 機(jī)構(gòu)并不是關(guān)注 DEI,而是專門測試國家安全風(fēng)險。我們需要繼續(xù)開展這方面的測試,我也看到了兩黨對此的支持。
談AI完成工作量主持人 : 您剛才提到"在 Anthropic 這只需要一個人一天的工作量",我想問一下,你們內(nèi)部是這樣衡量工作的嗎?你們會不會稱之為"一個 Claude 天"之類的?畢竟隨著 Claude 做的事越來越多,它也能幫助人們做更多工作。你們是否用這種方式來思考問題?
Dario Amodei: 我們確實會這樣想,"這里有一部分是人來做,一部分是 AI 模型來做,兩者在很多方面是互補(bǔ)的。有一定數(shù)量的計算資源,也有一定數(shù)量的人力。"我認(rèn)為整個經(jīng)濟(jì)都要開始采用這種思維方式。我在《Machines of Loving Grace》一文中提到過"對智力的邊際回報"這個概念。經(jīng)濟(jì)學(xué)家會討論對土地、勞動、資本、技術(shù)的邊際回報,而我認(rèn)為我們也應(yīng)該開始討論對"智力"的邊際回報。有些任務(wù),智力能提供很大幫助;另一些領(lǐng)域,可能存在物理限制或社會限制,智力的作用就比較有限。因此我認(rèn)為這種思考方式不僅會在 Anthropic 內(nèi)部越來越普遍,也應(yīng)該在全球范圍內(nèi)得到更廣泛的應(yīng)用。
主持人 : 亞馬遜最近給你們投資了 40 億美元,這是眾所周知的。據(jù)我所知,你們還籌集了更多資金,可能達(dá)到 20 億美元。您能確認(rèn)這個數(shù)字嗎?是這樣嗎?
Dario Amodei: 我......我無法透露任何關(guān)于正在進(jìn)行的融資的具體情況。不過如果你把我們所有已公布或報道過的融資金額加起來,總數(shù)確實已達(dá)到"數(shù)十億美元"這個量級。如果我們把視角放寬一些......你問我,"你們是如何與這些科技巨頭合作的?是他們主導(dǎo),還是你們主導(dǎo)?"我想說,一方面這些合作關(guān)系本身是合理的,因為我們需要大量的計算資源,而且需要預(yù)先投入大量資金來訓(xùn)練這些模型。在實際部署時,這些模型通常也是在云端部署的,因為云端能夠提供安全標(biāo)準(zhǔn)。所以從經(jīng)濟(jì)角度看,這種合作是有意義的。但我們的獨(dú)立性對我們來說也至關(guān)重要。因此我們同時與多家云服務(wù)提供商合作,比如我們既與亞馬遜合作,也與谷歌合作。每次與這些云服務(wù)提供商簽訂合同時,我們都會確保遵循"負(fù)責(zé)任的擴(kuò)展政策",這是我們關(guān)于如何測試、處理和保障新模型安全的一套原則。每次我們與云服務(wù)提供商合作、簽訂新協(xié)議時,我們都會確保在云端部署這些模型的方式符合我們的"負(fù)責(zé)任的擴(kuò)展政策"。這實際上會產(chǎn)生連鎖反應(yīng),比如促使這些云服務(wù)商開始更快地接受類似的政策。所以我將這稱為一種"向上競爭"的范例:我們樹立一個標(biāo)桿,然后其他公司也可能跟進(jìn)采取一些積極的措施。
主持人 : 好的,我再問最后一個問題。這也是很多人經(jīng)常問到的,我們一直在談?wù)?AI 將如何進(jìn)入職場。對那些即將在 AI 時代開始職業(yè)生涯的年輕人,您有什么最好的建議?即使是還在上高中、大學(xué)的學(xué)生,應(yīng)該做些什么準(zhǔn)備?
Dario Amodei:我有幾點想說。第一點是顯而易見的:要學(xué)會使用這些新技術(shù)。在變化如此之快的時代,能夠跟上節(jié)奏的人會比跟不上的人處境好得多。第二點,可能是最重要的要培養(yǎng)批判性思維能力,F(xiàn)在 AI 系統(tǒng)能夠生成各種極其逼真的解釋、圖像、視頻,信息生態(tài)似乎被徹底攪亂或顛覆了。要分辨真?zhèn)涡枰冻鰳O大努力,F(xiàn)在更像是一個"叢林",而不再是一個"被精心策劃的環(huán)境"。我擔(dān)心 AI 的某些方面可能會讓這種狀況更加惡化。所以我們一定要訓(xùn)練自己去審視、質(zhì)疑:"這個說法合理嗎?是真實的嗎?"你去 X 平臺上看看,很多內(nèi)容有十萬點贊,但你看了會覺得,"這太離譜了,完全說不通。"然而過去那種"被策劃好的信息環(huán)境"已經(jīng)不復(fù)存在。我們必須讓當(dāng)下這個自由的"信息市場"能在某種程度上最終"收斂"到真相。我認(rèn)為批判性思維技能在這里將變得尤為重要。同時,我也希望我們能夠利用 AI 來幫助培養(yǎng)這些批判性思維技能,而不是進(jìn)一步破壞信息環(huán)境。
來源:官方媒體/網(wǎng)絡(luò)新聞
編輯:深思
主編:圖靈