展會(huì)信息港展會(huì)大全

人形機(jī)器人正在“長出”腦子和雙手
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-28 12:27:22   瀏覽:378次  

導(dǎo)讀:人形機(jī)器人能走了,這一點(diǎn)在2024年變得無比明確。近日一場(chǎng)行業(yè)展覽上,第一財(cái)經(jīng)記者抓住宇樹科技一款人形機(jī)器人后背的把手阻止它繼續(xù)前進(jìn),一松手,機(jī)器人猛地往前一個(gè)趔趄,但馬上恢復(fù)了平衡。自年初一些人形機(jī)器人公司展示了機(jī)器人翻跟斗、做俯臥撐,運(yùn)動(dòng)能力成為各大廠商的比拼焦點(diǎn)。3月,逐際動(dòng)力的雙足機(jī)器人在深圳塘朗山復(fù)雜地形中進(jìn)行了徒步測(cè)試;5月,宇樹科技人形機(jī)器 ......

人形機(jī)器人正在“長出”腦子和雙手

人形機(jī)器人能走了,這一點(diǎn)在2024年變得無比明確。近日一場(chǎng)行業(yè)展覽上,第一財(cái)經(jīng)記者抓住宇樹科技一款人形機(jī)器人后背的把手阻止它繼續(xù)前進(jìn),一松手,機(jī)器人猛地往前一個(gè)趔趄,但馬上恢復(fù)了平衡。

自年初一些人形機(jī)器人公司展示了機(jī)器人翻跟斗、做俯臥撐,運(yùn)動(dòng)能力成為各大廠商的比拼焦點(diǎn)。3月,逐際動(dòng)力的雙足機(jī)器人在深圳塘朗山復(fù)雜地形中進(jìn)行了徒步測(cè)試;5月,宇樹科技人形機(jī)器人在視頻中演示了被踹、被拳擊,該公司四輪足機(jī)器狗近日又演示了側(cè)空翻和載人行走,引起市場(chǎng)關(guān)注;波士頓動(dòng)力的人形機(jī)器人近日也裝扮成圣誕老人,來了一次空翻。

人形機(jī)器人正在“長出”腦子和雙手

與下半身運(yùn)動(dòng)能力飛速進(jìn)步不同,人形機(jī)器人上半身還顯得有些尷尬。一些未經(jīng)加速的人形機(jī)器人靈巧操作視頻中,機(jī)器人的手緩慢笨拙,這一定程度上源于算力芯片無法支持機(jī)器人的大腦快速運(yùn)轉(zhuǎn)。年內(nèi)掀起的機(jī)器人進(jìn)廠打工潮中,人形機(jī)器人也只能做分揀硬件部件、貼車標(biāo)、安裝鋼板這種粗活,且動(dòng)作明顯慢于人類。

業(yè)內(nèi)人士告訴記者,如果將人形機(jī)器人粗略拆解,下半身成熟度明顯更高。如果將上半身繼續(xù)拆解,扮演大腦角色的算力芯片和負(fù)責(zé)靈巧操作的靈巧手是兩大關(guān)鍵器官。這兩大器官遠(yuǎn)未成熟,技術(shù)方案也還沒收斂,但演進(jìn)越來越快了。

“人形機(jī)器人給多少算力都不夠

有芯片行業(yè)人士告訴記者,在手機(jī)上,算力芯片占整機(jī)成本的比例可能將近一半。在人形機(jī)器人身上,算力芯片的占比沒有這么高,但作為大腦的角色,算力芯片仍具有核心作用。多名人形機(jī)器人業(yè)內(nèi)人士告訴記者,目前嚴(yán)肅場(chǎng)景下人形機(jī)器人主要用到英偉達(dá)Orin芯片算力,該系列芯片算力在200TOPS~275TOPS之間。這個(gè)算力對(duì)人形機(jī)器人而言不太夠用。

智元機(jī)器人研究院執(zhí)行院長姚卯青告訴記者,高階具身智能的最終算力可能需要500TOPS以上才能跑幾十億參數(shù)的大模型。明年英偉達(dá)可能會(huì)推出下一代Thor芯片,算力或達(dá)2000TOPS以上。現(xiàn)在人形機(jī)器人在制造業(yè)中工作的節(jié)拍還很慢,達(dá)不到人類的水平。當(dāng)算力上千TOPS時(shí),大模型參數(shù)量將不再局限在2B、3B(B即10億),機(jī)器人將有更高的執(zhí)行效率。

從地平線分拆出來的芯片及解決方案廠商地瓜機(jī)器人開發(fā)者生態(tài)負(fù)責(zé)人胡春旭告訴記者,對(duì)通用機(jī)器人而言,算力是最基本的。50TOPS算力對(duì)掃地機(jī)器人、割草機(jī)器人或許夠了,但當(dāng)下人形機(jī)器人屬于給多少算力都不夠的情況,因?yàn)槿诵螜C(jī)器人領(lǐng)域還不收斂,在一些問題未解決時(shí)業(yè)內(nèi)會(huì)把所有能用的功能塞進(jìn)機(jī)器。目前人形機(jī)器人能用到的芯片近300TOPS,公司目前最高算力的芯片則在100TOPS左右。長遠(yuǎn)看,還沒人能斷言芯片算力要多少,可能是500TOPS,可能是1000TOPS,也可能會(huì)收斂到300TOPS。

要做好人形機(jī)器人的大腦,除了要解決硬件算力限制,更關(guān)鍵的問題是芯片的易用性,也就是芯片能部署并運(yùn)行合適的算法。芯片廠商不僅要做硬件,還要做算法、搭平臺(tái),而要做好算法,則需要獲取高質(zhì)量數(shù)據(jù)來訓(xùn)練,這對(duì)芯片廠商而言已是挑戰(zhàn)。

以專用的掃地機(jī)器人為例,獲得高質(zhì)量數(shù)據(jù)來訓(xùn)練算法就已經(jīng)不簡單。據(jù)胡春旭介紹,車的數(shù)據(jù)大部分是公路數(shù)據(jù),相對(duì)結(jié)構(gòu)化,且路上有上千萬臺(tái)可以持續(xù)采集數(shù)據(jù),家庭場(chǎng)景的復(fù)雜度高得多,掃地機(jī)器人需要應(yīng)對(duì)的狀況可能是隨處丟的襪子、一個(gè)插線板、跑來跑去的小朋友,很多掃地機(jī)器人還難以連接云端上傳數(shù)據(jù),導(dǎo)致數(shù)據(jù)缺失。人形機(jī)器人被人們寄予了通用的期望,需要能完成很多專用機(jī)器人的工作,相比之下算法復(fù)雜度更高,數(shù)據(jù)缺失問題也很嚴(yán)重。

“(人形機(jī)器人)行業(yè)最大痛點(diǎn)是數(shù)據(jù)沒有沉淀,如果造一堆真機(jī)去產(chǎn)生數(shù)據(jù),成本很高,大家都受不了,如果做一個(gè)虛擬環(huán)境來產(chǎn)生數(shù)據(jù),跟真實(shí)數(shù)據(jù)還是有差距! 胡春旭說。為此,地瓜機(jī)器人同時(shí)做硬件和算法、軟件、工具鏈、平臺(tái)等,投入最多的不是硬件,而是后面這部分,對(duì)于數(shù)據(jù)缺失的痛點(diǎn)則關(guān)注降低平臺(tái)成本,使真實(shí)數(shù)據(jù)更易獲取,同時(shí)做數(shù)據(jù)虛擬化產(chǎn)生工作并讓數(shù)據(jù)能傳到云端,做數(shù)據(jù)再訓(xùn)練。

“做靈巧手相當(dāng)于再造一個(gè)機(jī)器人”

機(jī)器人的腦子還不成熟,手也不怎么靈活。人們能在演示視頻或各大展會(huì)上看到,人形機(jī)器人用手削黃瓜、倒咖啡、炒菜、撫摸貓咪。但這些精巧操作的另一面是,人形機(jī)器人廠商需要提前準(zhǔn)備、精心設(shè)計(jì),通過模仿學(xué)習(xí)等方式教會(huì)人形機(jī)器人執(zhí)行這些任務(wù)。在年內(nèi)一場(chǎng)媒體溝通會(huì)上,廠商方面的負(fù)責(zé)人問在場(chǎng)的媒體,要讓人形機(jī)器人做什么動(dòng)作,才能讓觀眾印象深刻;蛟S正是因?yàn)槿诵螜C(jī)器人的雙手仍無法天然勝任很多人類工作,精心設(shè)計(jì)動(dòng)作、向人們展示機(jī)器人進(jìn)入家庭和千行百業(yè)的前景才如此重要。

相比下半身,手部靈巧操作確是人形機(jī)器人諸多難點(diǎn)所在。姚卯青告訴記者,下半身目標(biāo)是穩(wěn)定站立和穩(wěn)定行動(dòng),整體難度較小,上肢操作自由度則非常多,需要執(zhí)行抓取、放置、推拉等動(dòng)作,操作精確度要求高。下半身運(yùn)動(dòng)的技術(shù)不一定都要通過AI實(shí)現(xiàn),上半身目前則是機(jī)器人學(xué)術(shù)聚焦的高地。

人形機(jī)器人正在“長出”腦子和雙手

較高的設(shè)計(jì)難度和較高成本既來自于靈巧手廠商對(duì)高自由度的追求,也來自由度提高后的算法難題。此外,靈巧手硬件設(shè)計(jì)方案五花八門,使得硬件成本短時(shí)間內(nèi)難以大幅下降,算法也難在合力之下飛速提升。

對(duì)高自由度的追求一定程度上源于特斯拉的帶動(dòng)。人手通常被認(rèn)為有27個(gè)自由度,多數(shù)集中在手掌及手指。11月底,特斯拉展示的Optimus人形機(jī)器人能用手接住網(wǎng)球并放下,動(dòng)作靈活,其采用的靈巧手自由度達(dá)到22個(gè),比前一代增加了11個(gè)。這個(gè)視頻引起業(yè)內(nèi)關(guān)注。姚卯青告訴記者,特斯拉展示了高自由度靈巧手后,業(yè)內(nèi)基本形成了要做高自由度的共識(shí)。

據(jù)記者了解,星動(dòng)紀(jì)元的五指靈巧手有12個(gè)主動(dòng)自由度,智元已商用發(fā)布的是6個(gè)主動(dòng)自由度和5個(gè)被動(dòng)自由度的靈巧手,智元還有一款更高自由度的手在研發(fā)階段。而就研發(fā)難度,一名靈巧手技術(shù)人員向記者形容,人形機(jī)器人不算上靈巧手,全身自由度可能在27個(gè)左右,再做一個(gè)靈巧手相當(dāng)于再造了一個(gè)機(jī)器人。

要提高自由度,廠商需要應(yīng)對(duì)更多算法上的困難。姚卯青解釋,自由度低的抓夾算法可以通過編程或模仿學(xué)習(xí)完成,高自由度靈巧手要進(jìn)行模仿學(xué)習(xí)則非常困難,因?yàn)閯?dòng)作很難被完整規(guī)劃。就像人類轉(zhuǎn)筆不是一個(gè)先想清楚方法再按計(jì)劃執(zhí)行的過程,而是轉(zhuǎn)出感覺、形成策略,這是典型的強(qiáng)化學(xué)習(xí),靈巧手也要經(jīng)過大規(guī)模針對(duì)單一任務(wù)的強(qiáng)化學(xué)習(xí)。經(jīng)過這種強(qiáng)化學(xué)習(xí)的靈巧手可以執(zhí)行任務(wù),例如通過不斷嘗試學(xué)會(huì)在工廠里插插頭。

但要提升算法表現(xiàn),又遇到了數(shù)據(jù)缺乏的難點(diǎn)。姚卯青告訴記者,手部還沒有如同計(jì)算機(jī)視覺領(lǐng)域ImageNet一般的公認(rèn)開源大規(guī)模數(shù)據(jù)集,對(duì)此,近期智元要開源一個(gè)全球最大規(guī)模的高質(zhì)量真機(jī)數(shù)據(jù)集,帶有觸覺數(shù)據(jù)。業(yè)內(nèi)也需解決靈巧手算法的通用性問題,記者從星動(dòng)紀(jì)元了解到,針對(duì)通用靈巧操作,該公司近日則推出紀(jì)元原生機(jī)器人大模型,讓機(jī)器人能從執(zhí)行特定任務(wù)演進(jìn)到能完成復(fù)雜度較高的多任務(wù)。

從硬件上看,靈巧手硬件設(shè)計(jì)方案則處于未收斂的階段,各廠商的靈巧手硬件方案五花八門,業(yè)內(nèi)研發(fā)力量還無法集中到一處。姚卯青告訴記者,高自由度帶來的難點(diǎn)包括要解決小型化問題,在一個(gè)手掌里集成幾十個(gè)電機(jī)非常困難,硬件也不太成熟,能用多久、一致性多高、可靠性和耐久性多強(qiáng)未經(jīng)實(shí)戰(zhàn)驗(yàn)證。

靈巧手硬件方案包括繩驅(qū)、連桿、電機(jī)直驅(qū)等。特斯拉采用繩驅(qū)方案,好處是電機(jī)位于手臂而不用都放在手掌、手指,通過繩子驅(qū)動(dòng)關(guān)節(jié)。據(jù)姚卯青解釋,繩驅(qū)方案較為主流,業(yè)內(nèi)更多往特斯拉的繩驅(qū)方案靠攏。不過,另有業(yè)內(nèi)人士表示,各種方案尚未分出伯仲,繩驅(qū)的劣勢(shì)在于繩子可能變形,導(dǎo)致動(dòng)作不是特別精確。電機(jī)直驅(qū)方案則是將空心杯馬達(dá)和減速箱放在關(guān)節(jié)處,較為靈活,但劣勢(shì)在于手上空間難以容納這么多部件。

人形機(jī)器人正在“長出”腦子和雙手

“各家方案非常不一樣,沒有收斂,未來方案會(huì)如何還需要進(jìn)一步探索!毙莿(dòng)紀(jì)元聯(lián)合創(chuàng)始人席悅告訴記者。姚卯青則展望,未來方案如果收斂且上量,好處是成本有望做到更低,當(dāng)業(yè)內(nèi)基于同一套硬件開發(fā)時(shí),算法也更容易聚焦。

記者了解到,靈巧手要用到的一些關(guān)鍵部件也有待成熟,其中一種是觸覺傳感器,其重要性在于,傳感器缺失的情況下機(jī)器人沒有感知能力,可能會(huì)捏壞礦泉水瓶或者撞傷自己。雖然觸覺傳感器如此重要,但有業(yè)內(nèi)人士向記者形容,觸覺傳感器未完全鋪開應(yīng)用,一些不帶觸覺傳感器的靈巧手還在“裸奔”。

記者了解到,目前國內(nèi)已經(jīng)有一些觸覺傳感器的廠商入局,各自提出了不同的方案,但該領(lǐng)域也還在發(fā)展初期。以上靈巧手技術(shù)人員告訴記者,觸覺傳感器的準(zhǔn)確度、靈敏度和穩(wěn)定性還需要再提升,目前觸覺傳感器行業(yè)的情況是有電容、電磁、電阻式、視觸覺等多種技術(shù)方案,各方案都不是很成熟,各供應(yīng)商也各有優(yōu)缺點(diǎn),還沒有哪種方案公認(rèn)是最好的。

開始降價(jià)了

不論是業(yè)內(nèi)還是外界,都在翹首期盼人形機(jī)器人降價(jià)。特斯拉CEO馬斯克的判斷是,未來人形機(jī)器人可以降到2萬~3萬美元一臺(tái),每個(gè)人都可以擁有自己的人形機(jī)器人。姚卯青也判斷,很快整個(gè)人形機(jī)器人的成本能做到20萬元以內(nèi)。

從算力芯片的成本看,席悅告訴記者,算力芯片在人形機(jī)器人身上的成本占比大概是幾十分之一。胡春旭告訴記者,在不同類型的機(jī)器人中,芯片成本占比差別不大,大約在7%~10%之間,一臺(tái)人形機(jī)器人均價(jià)50萬的情況下,芯片這一層的成本不超過1萬元。不過,未來在人形機(jī)器人電機(jī)等部件成本下行的情況下,芯片部分成本占比預(yù)計(jì)有所增加。

業(yè)內(nèi)開始展望算力芯片降價(jià)。“目前還看不到出貨量增加多少、成本減少多少的線性關(guān)系,基于芯片設(shè)計(jì)和制造的特點(diǎn),成本降低將是階梯式的,當(dāng)未來達(dá)到一定量時(shí),成本會(huì)立即降低很多!焙盒衽袛。

靈巧手現(xiàn)在則偏貴,一個(gè)原因是靈巧手上用的觸覺傳感器價(jià)格偏貴。席悅表示,星動(dòng)紀(jì)元的靈巧手帶有觸覺傳感器,手占人形機(jī)器人全身成本大概1/5到1/4。據(jù)靈巧手廠商強(qiáng)腦科技銷售人員介紹,公司在售的手有4萬元和5.5萬元的產(chǎn)品, 5.5萬元的靈巧手主要的區(qū)別包括用了5個(gè)觸覺傳感器。

“現(xiàn)在觸覺傳感器還很貴,甚至可能比整只不帶觸覺傳感器的靈巧手更貴,可能是還沒上量的原因。一只手用到的觸覺傳感器可能要大幾千元,一只手上的觸覺傳感器只有在占手的成本10%左右的時(shí)候才可能大規(guī)模應(yīng)用! 姚卯青告訴記者。

觸覺傳感器降價(jià)已經(jīng)開始。帕西尼感知聯(lián)合創(chuàng)始人聶相如告訴記者,10年前,一片傳感器價(jià)格曾是1.1萬美元,包括一些工業(yè)用的六維力傳感器當(dāng)時(shí)大概能賣到一片10萬元左右。幾年前該公司做的觸覺傳感器一片大幾千元,去年年初價(jià)格降到3000~4000元,現(xiàn)在正式批量開售,價(jià)格則是大幾百元,原因既包括量產(chǎn)后得以平攤成本,也有包括技術(shù)改進(jìn)的因素。數(shù)量增加后,公司更好與上游談價(jià)格,該公司也通過自己做芯片降低了部分成本。

人形機(jī)器人正在“長出”腦子和雙手

靈巧手中的其他部件也在望向降價(jià)。就采用電機(jī)直驅(qū)方案的靈巧手方案,有廠家告訴記者,在不加很多觸覺傳感器的情況下,空心杯馬達(dá)加減速箱的組合是靈巧手成本中最大的一塊,或高達(dá)80%。目前一個(gè)空心杯馬達(dá)加減速器的組合產(chǎn)品可賣到1000多元,性能較一般的也有幾百元的產(chǎn)品,一個(gè)能主動(dòng)運(yùn)動(dòng)的手關(guān)節(jié)就可用到一個(gè)這種組合產(chǎn)品。

記者了解到,在靈巧手還沒有起量的時(shí)候,有些空心杯馬達(dá)和減速箱廠商還是向人形機(jī)器人廠商單次銷售幾個(gè)組合產(chǎn)品,銷售量不大。但有廠家告訴記者,在以10萬個(gè)為單位批量銷售的情況下,工廠可以優(yōu)化生產(chǎn)排布、一次性投入設(shè)備,一個(gè)原本1000多元的產(chǎn)品價(jià)格就能降到幾百元。

姚卯青預(yù)計(jì),明年手的成本會(huì)快速降低,智元今年量產(chǎn)后,靈巧手成本可以比較有競爭力。未來,一只靈巧手的成本應(yīng)該降到5000元以內(nèi)。

(本文來自第一財(cái)經(jīng))

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港