當(dāng)前位置：人工智能實(shí)驗(yàn)室> 機(jī)器人 > 英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-01-21 19:32:48 瀏覽：227次

導(dǎo)讀：夢(mèng)晨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI2025，人形機(jī)器人量產(chǎn)元年。CES上老黃帶著14臺(tái)機(jī)器人亮相這一幕剛過去不久，SemiAnalysis分析師的一條預(yù)測(cè)再次引起熱議。英偉達(dá)最終將成為一家機(jī)器人公司，而不僅僅是半導(dǎo)體公司。只有少數(shù)人理解他們最底層的布局，從制造到軟件。這樣的觀點(diǎn)從何而來(lái)？英偉達(dá)在機(jī)器人上究竟有哪些布局？又為什么明確不直接下場(chǎng)制造機(jī)器人？在英偉達(dá)北京 ......

夢(mèng)晨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI

2025，人形機(jī)器人量產(chǎn)元年。

CES上老黃帶著14臺(tái)機(jī)器人亮相這一幕剛過去不久，SemiAnalysis分析師的一條預(yù)測(cè)再次引起熱議。

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”

英偉達(dá)最終將成為一家機(jī)器人公司，而不僅僅是半導(dǎo)體公司。只有少數(shù)人理解他們最底層的布局，從制造到軟件。

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”

這樣的觀點(diǎn)從何而來(lái)？英偉達(dá)在機(jī)器人上究竟有哪些布局？又為什么明確不直接下場(chǎng)制造機(jī)器人？

在英偉達(dá)北京辦公室，英偉達(dá)機(jī)器人與邊緣計(jì)算副總裁Deepu Talla回答了一切。

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”

三臺(tái)計(jì)算機(jī)，迎來(lái)機(jī)器人的ChatGPT時(shí)刻（以下為Deepu Talla演講內(nèi)容整理）

對(duì)我來(lái)說(shuō)，有三個(gè)主要原因使機(jī)器人技術(shù)變得不可或缺：

危險(xiǎn)工種。比如礦工或者在危險(xiǎn)環(huán)境中工作的人員，機(jī)器人可以替代人類承擔(dān)這些危險(xiǎn)任務(wù)。

勞動(dòng)力短缺。每一代人選擇的職業(yè)都與上一代不同。比如，我的祖父母是農(nóng)民，但我的父母離開了農(nóng)業(yè)，而我甚至從未從事過農(nóng)業(yè)。工作在不斷演變，勞動(dòng)力短缺問題也隨之加劇。

養(yǎng)老需求。人類的壽命越來(lái)越長(zhǎng)。如今，全球平均預(yù)期壽命已超過75歲，而25年前僅為67歲，50年前則只有57到58歲。再過25年，或許壽命會(huì)超過100歲，也許以后甚至能達(dá)到150歲。但如果人類活到200歲呢？你希望由75歲的孩子來(lái)照顧你嗎？大概不會(huì)。所以我們需要“社會(huì)伴侶”機(jī)器人，來(lái)幫助解決護(hù)理和陪伴的問題。

這些并不是什么新信息，但情況確實(shí)發(fā)生了變化。從2024年到2025年，對(duì)機(jī)器人技術(shù)的興趣顯著增長(zhǎng)。

各國(guó)的企業(yè)都在探索如何開發(fā)人形機(jī)器人。為什么是現(xiàn)在，而不是兩年前？發(fā)生了什么改變？

有兩個(gè)主要原因：

技術(shù)進(jìn)步，特別是在生成式AI（GenAI）領(lǐng)域。

大約兩年前，大型語(yǔ)言模型（LLMs）顛覆了數(shù)字應(yīng)用領(lǐng)域�，F(xiàn)在，這些技術(shù)也開始應(yīng)用于機(jī)器人技術(shù)，打破了數(shù)字應(yīng)用與物理應(yīng)用之間的界限。

仿真環(huán)境的改進(jìn)，制造一個(gè)機(jī)器人非常昂貴，因?yàn)樗鼈儾⑽磳?shí)現(xiàn)大規(guī)模量產(chǎn)，這使得成本高昂。

在物理世界中取得進(jìn)展同樣需要大量時(shí)間，因?yàn)橐磺卸甲裱罢鎸?shí)時(shí)間”（即我們所說(shuō)的“墻鐘時(shí)間”）。以前，機(jī)器人技術(shù)的測(cè)試主要依賴于物理環(huán)境，這導(dǎo)致進(jìn)展非常緩慢。那么過去12個(gè)月中發(fā)生了什么變化呢？

過去一年中，NVIDIA開發(fā)了一項(xiàng)名為Omniverse的技術(shù)。你可以將其作一種仿真環(huán)境，一個(gè)“綠色”環(huán)境。這項(xiàng)技術(shù)已經(jīng)取得了顯著成熟盡管還未完全解決所有問題，但其發(fā)展水平已相當(dāng)于生成式AI在仿真領(lǐng)域的應(yīng)用水平。現(xiàn)在，想象一下，借助這些技術(shù)進(jìn)步，機(jī)器人開發(fā)流程可以變得快得多。

因此，在接下來(lái)的5到10年里，我們將在機(jī)器人領(lǐng)域看到顯著的差異。這就是為什么現(xiàn)在每家公司都在專注于推動(dòng)這一領(lǐng)域的發(fā)展。我與許多公司討論過，他們都在研究與機(jī)器人相關(guān)的問題以及通用型機(jī)器人“大腦”模型的開發(fā)。這就是未來(lái)一個(gè)能夠幫助解決危險(xiǎn)工作、勞動(dòng)力短缺以及企業(yè)運(yùn)營(yíng)挑戰(zhàn)的未來(lái)。

這一進(jìn)展令人無(wú)比激動(dòng)。一年前，這一方向是否能成功還并不明朗。雖然之前已經(jīng)有不少努力，但過去6到12個(gè)月的突破性發(fā)展改變了一切。

現(xiàn)在，當(dāng)人們談?wù)摍C(jī)器人時(shí)，大多數(shù)人會(huì)想到物理機(jī)器人那些像人或工業(yè)工具的具體機(jī)器。這種物理形態(tài)是目標(biāo)，最終的成果。但通向這個(gè)目標(biāo)的道路非常復(fù)雜。為了真正解決機(jī)器人領(lǐng)域的挑戰(zhàn)，我們需要三臺(tái)計(jì)算機(jī)：

第一臺(tái)計(jì)算機(jī)用于訓(xùn)練：這是用于訓(xùn)練AI模型的系統(tǒng)。訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA DGX這樣的強(qiáng)大系統(tǒng)上進(jìn)行。這是構(gòu)建機(jī)器人“大腦”的關(guān)鍵步驟。

第二臺(tái)計(jì)算機(jī)用于仿真：一旦訓(xùn)練完成，就需要進(jìn)行測(cè)試。以往的標(biāo)準(zhǔn)是物理測(cè)試，但這種方式既慢又昂貴，還存在風(fēng)險(xiǎn)。更好的解決方案是引入一個(gè)“仿真層”，即“數(shù)字孿生”，在虛擬環(huán)境中完成測(cè)試。仿真允許在大規(guī)模、快速且安全的條件下運(yùn)行數(shù)千種場(chǎng)景測(cè)試，無(wú)需受到真實(shí)世界時(shí)間或成本的限制。

第三臺(tái)計(jì)算機(jī)用于部署：第三種系統(tǒng)安裝在機(jī)器人內(nèi)部，它就是操作物理機(jī)器人的“大腦”。對(duì)NVIDIA來(lái)說(shuō)，這可以通過像Jetson或AGX這樣的系統(tǒng)來(lái)實(shí)現(xiàn)。

通過整合這三種系統(tǒng)，我們可以顯著縮短開發(fā)時(shí)間。在現(xiàn)實(shí)世界部署之前，通過仿真進(jìn)行成千上萬(wàn)次測(cè)試，加速整個(gè)流程。如果某個(gè)設(shè)計(jì)在現(xiàn)實(shí)中表現(xiàn)不佳，可以回到仿真環(huán)境中優(yōu)化模型并再次測(cè)試。這個(gè)循環(huán)過程（訓(xùn)練、仿真、測(cè)試）使得機(jī)器人技術(shù)的進(jìn)步能夠在5年內(nèi)完成，而不是50年。

這種方法也解釋了為什么機(jī)器人技術(shù)比自動(dòng)駕駛更難。對(duì)于自動(dòng)駕駛來(lái)說(shuō)，主要是避免障礙并確保安全，而無(wú)需與物理物體交互。而在機(jī)器人領(lǐng)域，涉及到的是與物體的接觸、碰撞和復(fù)雜的物理交互，這些都更難測(cè)試和優(yōu)化。

仿真并不是一個(gè)新概念。例如，在芯片設(shè)計(jì)領(lǐng)域，100%的芯片在制造之前都需要進(jìn)行仿真，以確保其功能完美無(wú)缺，因?yàn)樾酒O(shè)計(jì)中的錯(cuò)誤可能導(dǎo)致數(shù)月的延誤，并耗費(fèi)數(shù)百萬(wàn)甚至數(shù)十億美元。

在機(jī)器人領(lǐng)域，主要的挑戰(zhàn)在于“仿真與現(xiàn)實(shí)的差距”（sim-to-real gap）也就是仿真結(jié)果與實(shí)際表現(xiàn)之間的差異。直到最近，仿真技術(shù)的精度還不足，因此未被廣泛采用。然而，像Omniverse這樣的技術(shù)進(jìn)步顯著縮小了這一差距。雖然這一差距尚未完全彌合，但改進(jìn)已經(jīng)足夠大，使仿真成為機(jī)器人開發(fā)中的一種可行且有效的工具。

在英偉達(dá)，我們并不直接制造機(jī)器人，而是與所有從事機(jī)器人制造或機(jī)器人解決方案開發(fā)的人員合作。我們正在構(gòu)建一個(gè)包含三種計(jì)算系統(tǒng)以及相關(guān)軟件工具和工作流程的平臺(tái)，幫助機(jī)器人專家、研究人員、機(jī)械工程師和測(cè)試人員更輕松地開發(fā)機(jī)器人解決方案。這一平臺(tái)旨在簡(jiǎn)化和加速整個(gè)過程。

現(xiàn)在，讓我們聚焦于機(jī)器人開發(fā)中的三個(gè)主要步驟：訓(xùn)練、測(cè)試和部署。

以AI模型訓(xùn)練為例。像ChatGPT這樣的流行模型是在大型GPU和來(lái)自互聯(lián)網(wǎng)的海量文本數(shù)據(jù)上訓(xùn)練出來(lái)的。但機(jī)器人模型的訓(xùn)練需要完全不同的數(shù)據(jù)。機(jī)器人需要執(zhí)行動(dòng)作，比如拾取物體、移動(dòng)、交互或完成任務(wù)。而遺憾的是，目前這種數(shù)據(jù)在規(guī)模上根本不存在。

數(shù)據(jù)收集與解決方案中有以下挑戰(zhàn)：

現(xiàn)實(shí)世界數(shù)據(jù)的局限性與自動(dòng)駕駛汽車可以依賴現(xiàn)有車輛通過傳感器收集數(shù)據(jù)不同，目前機(jī)器人的數(shù)量還遠(yuǎn)遠(yuǎn)不足以產(chǎn)生可比的數(shù)據(jù)量。

當(dāng)前的方法包括使用Apple Vision Pro或動(dòng)作捕捉套裝來(lái)記錄人類動(dòng)作的示范。這些方法雖能提供有用的數(shù)據(jù)，但規(guī)模太小，無(wú)法完全滿足機(jī)器人模型的訓(xùn)練需求。

合成數(shù)據(jù)生成的重要性

上一篇：AI大模型的能力比拼或許不再拘泥于“算力”

下一篇：韓國(guó)研究團(tuán)隊(duì)開發(fā)出類腦芯片，能夠自主學(xué)習(xí)并糾正錯(cuò)誤

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-01-21 19:32:48 瀏覽：227次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)” 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-01-21 19:32:48 瀏覽：227次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái)：50年縮至5年，靠“三臺(tái)計(jì)算機(jī)”
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-01-21 19:32:48 瀏覽：227次