展會(huì)信息港展會(huì)大全

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái):50年縮至5年,靠“三臺(tái)計(jì)算機(jī)”
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-01-21 19:32:48   瀏覽:227次  

導(dǎo)讀:夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI2025,人形機(jī)器人量產(chǎn)元年。CES上老黃帶著14臺(tái)機(jī)器人亮相這一幕剛過去不久,SemiAnalysis分析師的一條預(yù)測(cè)再次引起熱議。英偉達(dá)最終將成為一家機(jī)器人公司,而不僅僅是半導(dǎo)體公司。只有少數(shù)人理解他們最底層的布局,從制造到軟件。這樣的觀點(diǎn)從何而來(lái)?英偉達(dá)在機(jī)器人上究竟有哪些布局?又為什么明確不直接下場(chǎng)制造機(jī)器人?在英偉達(dá)北京 ......

夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI

2025,人形機(jī)器人量產(chǎn)元年。

CES上老黃帶著14臺(tái)機(jī)器人亮相這一幕剛過去不久,SemiAnalysis分析師的一條預(yù)測(cè)再次引起熱議。

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái):50年縮至5年,靠“三臺(tái)計(jì)算機(jī)”

英偉達(dá)最終將成為一家機(jī)器人公司,而不僅僅是半導(dǎo)體公司。只有少數(shù)人理解他們最底層的布局,從制造到軟件。

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái):50年縮至5年,靠“三臺(tái)計(jì)算機(jī)”

這樣的觀點(diǎn)從何而來(lái)?英偉達(dá)在機(jī)器人上究竟有哪些布局?又為什么明確不直接下場(chǎng)制造機(jī)器人?

在英偉達(dá)北京辦公室,英偉達(dá)機(jī)器人與邊緣計(jì)算副總裁Deepu Talla回答了一切。

英偉達(dá)在北京透露了人形機(jī)器人的未來(lái):50年縮至5年,靠“三臺(tái)計(jì)算機(jī)”

三臺(tái)計(jì)算機(jī),迎來(lái)機(jī)器人的ChatGPT時(shí)刻(以下為Deepu Talla演講內(nèi)容整理)

對(duì)我來(lái)說(shuō),有三個(gè)主要原因使機(jī)器人技術(shù)變得不可或缺

危險(xiǎn)工種。比如礦工或者在危險(xiǎn)環(huán)境中工作的人員,機(jī)器人可以替代人類承擔(dān)這些危險(xiǎn)任務(wù)。

勞動(dòng)力短缺。每一代人選擇的職業(yè)都與上一代不同。比如,我的祖父母是農(nóng)民,但我的父母離開了農(nóng)業(yè),而我甚至從未從事過農(nóng)業(yè)。工作在不斷演變,勞動(dòng)力短缺問題也隨之加劇。

養(yǎng)老需求。人類的壽命越來(lái)越長(zhǎng)。如今,全球平均預(yù)期壽命已超過75歲,而25年前僅為67歲,50年前則只有57到58歲。再過25年,或許壽命會(huì)超過100歲,也許以后甚至能達(dá)到150歲。但如果人類活到200歲呢?你希望由75歲的孩子來(lái)照顧你嗎?大概不會(huì)。所以我們需要“社會(huì)伴侶”機(jī)器人,來(lái)幫助解決護(hù)理和陪伴的問題。

這些并不是什么新信息,但情況確實(shí)發(fā)生了變化。從2024年到2025年,對(duì)機(jī)器人技術(shù)的興趣顯著增長(zhǎng)。

各國(guó)的企業(yè)都在探索如何開發(fā)人形機(jī)器人。為什么是現(xiàn)在,而不是兩年前?發(fā)生了什么改變?

有兩個(gè)主要原因:

技術(shù)進(jìn)步,特別是在生成式AI(GenAI)領(lǐng)域。

大約兩年前,大型語(yǔ)言模型(LLMs)顛覆了數(shù)字應(yīng)用領(lǐng)域,F(xiàn)在,這些技術(shù)也開始應(yīng)用于機(jī)器人技術(shù),打破了數(shù)字應(yīng)用與物理應(yīng)用之間的界限。

仿真環(huán)境的改進(jìn),制造一個(gè)機(jī)器人非常昂貴,因?yàn)樗鼈儾⑽磳?shí)現(xiàn)大規(guī)模量產(chǎn),這使得成本高昂。

在物理世界中取得進(jìn)展同樣需要大量時(shí)間,因?yàn)橐磺卸甲裱罢鎸?shí)時(shí)間”(即我們所說(shuō)的“墻鐘時(shí)間”)。以前,機(jī)器人技術(shù)的測(cè)試主要依賴于物理環(huán)境,這導(dǎo)致進(jìn)展非常緩慢。那么過去12個(gè)月中發(fā)生了什么變化呢?

過去一年中,NVIDIA開發(fā)了一項(xiàng)名為Omniverse的技術(shù)。你可以將其作一種仿真環(huán)境,一個(gè)“綠色”環(huán)境。這項(xiàng)技術(shù)已經(jīng)取得了顯著成熟盡管還未完全解決所有問題,但其發(fā)展水平已相當(dāng)于生成式AI在仿真領(lǐng)域的應(yīng)用水平。現(xiàn)在,想象一下,借助這些技術(shù)進(jìn)步,機(jī)器人開發(fā)流程可以變得快得多。

因此,在接下來(lái)的5到10年里,我們將在機(jī)器人領(lǐng)域看到顯著的差異。這就是為什么現(xiàn)在每家公司都在專注于推動(dòng)這一領(lǐng)域的發(fā)展。我與許多公司討論過,他們都在研究與機(jī)器人相關(guān)的問題以及通用型機(jī)器人“大腦”模型的開發(fā)。這就是未來(lái)一個(gè)能夠幫助解決危險(xiǎn)工作、勞動(dòng)力短缺以及企業(yè)運(yùn)營(yíng)挑戰(zhàn)的未來(lái)。

這一進(jìn)展令人無(wú)比激動(dòng)。一年前,這一方向是否能成功還并不明朗。雖然之前已經(jīng)有不少努力,但過去6到12個(gè)月的突破性發(fā)展改變了一切。

現(xiàn)在,當(dāng)人們談?wù)摍C(jī)器人時(shí),大多數(shù)人會(huì)想到物理機(jī)器人那些像人或工業(yè)工具的具體機(jī)器。這種物理形態(tài)是目標(biāo),最終的成果。但通向這個(gè)目標(biāo)的道路非常復(fù)雜。為了真正解決機(jī)器人領(lǐng)域的挑戰(zhàn),我們需要三臺(tái)計(jì)算機(jī):

第一臺(tái)計(jì)算機(jī)用于訓(xùn)練:這是用于訓(xùn)練AI模型的系統(tǒng)。訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA DGX這樣的強(qiáng)大系統(tǒng)上進(jìn)行。這是構(gòu)建機(jī)器人“大腦”的關(guān)鍵步驟。

第二臺(tái)計(jì)算機(jī)用于仿真:一旦訓(xùn)練完成,就需要進(jìn)行測(cè)試。以往的標(biāo)準(zhǔn)是物理測(cè)試,但這種方式既慢又昂貴,還存在風(fēng)險(xiǎn)。更好的解決方案是引入一個(gè)“仿真層”,即“數(shù)字孿生”,在虛擬環(huán)境中完成測(cè)試。仿真允許在大規(guī)模、快速且安全的條件下運(yùn)行數(shù)千種場(chǎng)景測(cè)試,無(wú)需受到真實(shí)世界時(shí)間或成本的限制。

第三臺(tái)計(jì)算機(jī)用于部署:第三種系統(tǒng)安裝在機(jī)器人內(nèi)部,它就是操作物理機(jī)器人的“大腦”。對(duì)NVIDIA來(lái)說(shuō),這可以通過像Jetson或AGX這樣的系統(tǒng)來(lái)實(shí)現(xiàn)。

通過整合這三種系統(tǒng),我們可以顯著縮短開發(fā)時(shí)間。在現(xiàn)實(shí)世界部署之前,通過仿真進(jìn)行成千上萬(wàn)次測(cè)試,加速整個(gè)流程。如果某個(gè)設(shè)計(jì)在現(xiàn)實(shí)中表現(xiàn)不佳,可以回到仿真環(huán)境中優(yōu)化模型并再次測(cè)試。這個(gè)循環(huán)過程(訓(xùn)練、仿真、測(cè)試)使得機(jī)器人技術(shù)的進(jìn)步能夠在5年內(nèi)完成,而不是50年。

這種方法也解釋了為什么機(jī)器人技術(shù)比自動(dòng)駕駛更難。對(duì)于自動(dòng)駕駛來(lái)說(shuō),主要是避免障礙并確保安全,而無(wú)需與物理物體交互。而在機(jī)器人領(lǐng)域,涉及到的是與物體的接觸、碰撞和復(fù)雜的物理交互,這些都更難測(cè)試和優(yōu)化。

仿真并不是一個(gè)新概念。例如,在芯片設(shè)計(jì)領(lǐng)域,100%的芯片在制造之前都需要進(jìn)行仿真,以確保其功能完美無(wú)缺,因?yàn)樾酒O(shè)計(jì)中的錯(cuò)誤可能導(dǎo)致數(shù)月的延誤,并耗費(fèi)數(shù)百萬(wàn)甚至數(shù)十億美元。

在機(jī)器人領(lǐng)域,主要的挑戰(zhàn)在于“仿真與現(xiàn)實(shí)的差距”(sim-to-real gap)也就是仿真結(jié)果與實(shí)際表現(xiàn)之間的差異。直到最近,仿真技術(shù)的精度還不足,因此未被廣泛采用。然而,像Omniverse這樣的技術(shù)進(jìn)步顯著縮小了這一差距。雖然這一差距尚未完全彌合,但改進(jìn)已經(jīng)足夠大,使仿真成為機(jī)器人開發(fā)中的一種可行且有效的工具。

在英偉達(dá),我們并不直接制造機(jī)器人,而是與所有從事機(jī)器人制造或機(jī)器人解決方案開發(fā)的人員合作。我們正在構(gòu)建一個(gè)包含三種計(jì)算系統(tǒng)以及相關(guān)軟件工具和工作流程的平臺(tái),幫助機(jī)器人專家、研究人員、機(jī)械工程師和測(cè)試人員更輕松地開發(fā)機(jī)器人解決方案。這一平臺(tái)旨在簡(jiǎn)化和加速整個(gè)過程。

現(xiàn)在,讓我們聚焦于機(jī)器人開發(fā)中的三個(gè)主要步驟:訓(xùn)練、測(cè)試和部署。

以AI模型訓(xùn)練為例。像ChatGPT這樣的流行模型是在大型GPU和來(lái)自互聯(lián)網(wǎng)的海量文本數(shù)據(jù)上訓(xùn)練出來(lái)的。但機(jī)器人模型的訓(xùn)練需要完全不同的數(shù)據(jù)。機(jī)器人需要執(zhí)行動(dòng)作,比如拾取物體、移動(dòng)、交互或完成任務(wù)。而遺憾的是,目前這種數(shù)據(jù)在規(guī)模上根本不存在。

數(shù)據(jù)收集與解決方案中有以下挑戰(zhàn):

現(xiàn)實(shí)世界數(shù)據(jù)的局限性與自動(dòng)駕駛汽車可以依賴現(xiàn)有車輛通過傳感器收集數(shù)據(jù)不同,目前機(jī)器人的數(shù)量還遠(yuǎn)遠(yuǎn)不足以產(chǎn)生可比的數(shù)據(jù)量。

當(dāng)前的方法包括使用Apple Vision Pro或動(dòng)作捕捉套裝來(lái)記錄人類動(dòng)作的示范。這些方法雖能提供有用的數(shù)據(jù),但規(guī)模太小,無(wú)法完全滿足機(jī)器人模型的訓(xùn)練需求。

合成數(shù)據(jù)生成的重要性

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港