蘇州市吳江區(qū),一個機器人正以2m/s的速度跑過太湖蘇州灣畔。
這個身高一米七四的人形機器人正在“拉練”,備戰(zhàn)4月份于北京舉行的全球首個人形機器人半程馬拉松。在過去的機器人實驗室中,相較于實際工業(yè)、家庭等應(yīng)用場景,機器人的跑步技能并沒有被擺在優(yōu)先級前列:工業(yè)場景更關(guān)注精準(zhǔn)度與負(fù)載能力,家庭服務(wù)則強調(diào)交互靈活性。這場賽事將機器人的跑步能力推至聚光燈下。機械結(jié)構(gòu)的耐久性、能源系統(tǒng)的效率、算法的魯棒性都將在21公里的賽程中,接受最直觀的檢驗。
畢竟,當(dāng)人形機器人站在同一起跑線,誰跑得更快、誰跑得更穩(wěn),都將一目了然。
機器人硬件的暴力測試
2024年12月底,在魔法原子的蘇州總部,記者看到了正在訓(xùn)練走路的人形機器人小麥。
正在進(jìn)行負(fù)重測試的小麥,身體前后方綁定了四塊鐵片,吊具下方,小麥已經(jīng)能夠在實地屈膝行走。不過,在路過一塊稍有不平的地磚時,小麥的步伐被打亂,重心偏移之下,被后方的工作人員迅速抓起擺正。
和人類學(xué)習(xí)跑步的過程一樣,在跑步之前,機器人首先要學(xué)會走路!爱(dāng)時新的小麥原型樣機剛出來不久,我們正在將算法遷移至機器人本體當(dāng)中!蹦Хㄔ痈笨偛眉嫜邪l(fā)負(fù)責(zé)人陳春玉告訴第一財經(jīng)記者,當(dāng)算法在實驗環(huán)境中準(zhǔn)備好,需要在算法遷移過程當(dāng)中,在新的機器人本體上進(jìn)行各種測試,針對新機器的硬件特點和算法進(jìn)行優(yōu)化和調(diào)整。
軟件和硬件的耦合程度,是機器人運動是否穩(wěn)定和流暢的關(guān)鍵。陳春玉舉例,如果機器人的電機、舵機等執(zhí)行機構(gòu)與控制軟件之間的配合出現(xiàn)問題,機器人就會變得“四仰八叉”!皺C器人想要轉(zhuǎn)一個彎,如果軟件發(fā)出的指令與電機實際轉(zhuǎn)動的角度存在偏差,那機器人的轉(zhuǎn)彎半徑不符合預(yù)期,就很容易摔倒。”
硬件需要配合算法做各種調(diào)試,陳春玉透露,這個不斷修正的過程需要2-3個月!霸隍炞C了穩(wěn)定性之后,我們才會嘗試新的算法,讓機器人實現(xiàn)奔跑等更加復(fù)雜的動作!
相比走路,跑步對于機器人來說,考驗的就不是單一的算法或是本體硬件,而是整個系統(tǒng)的極限。靈寶CASBOT聯(lián)合創(chuàng)始人兼運動智能研發(fā)中心負(fù)責(zé)人楊國棟告訴第一財經(jīng)記者,越接近人類體型的人形機器人,跑起來就越吃力!坝布Y(jié)構(gòu)越復(fù)雜、機身越重,運動負(fù)擔(dān)就越重!
而超過21公里的馬拉松,對于機器人來說,幾乎是一場關(guān)于硬件的“暴力測試”。
從機器人重量和關(guān)節(jié)扭矩的關(guān)系來看,跑步對于機器人的膝關(guān)節(jié)、踝關(guān)節(jié)的扭矩要求極高。“機身越重,對關(guān)節(jié)扭矩的要求會呈現(xiàn)指數(shù)級增長!睏顕鴹澱f。記者注意到,當(dāng)前市面中雙足人形機器人基本分為兩類,一類是以宇樹、智元為代表,身高比成年人更矮,在一米三左右,體重則在35公斤上下。而另一類雙足人形機器人則在外表上更像成年人,比如靈寶的CASBOT 01和魔法原子的小麥,身高超過一米七,體重也在60公斤左右。
對于機器人來說,長時間地跑步也意味著電機要持續(xù)高功率輸出。持續(xù)輸出之下,一旦散熱系統(tǒng)跟不上,電機就可能因為過熱而損壞。另一方面,在長期的高負(fù)荷運轉(zhuǎn)狀態(tài)之下,本體內(nèi)部零件磨損加劇,使用壽命也面臨重新評估!霸跈C器人本體各部位都會承受較大的沖擊力和震動之下,我們會考慮重新考慮機器人的機械結(jié)構(gòu)!睏顕鴹澩嘎叮`寶正在考慮迭代一款更輕巧的構(gòu)型,來面對不同的場景。
馬拉松背后的技術(shù)和市場暗戰(zhàn)
一位和比賽主辦方有過溝通的機器人企業(yè)相關(guān)負(fù)責(zé)人向第一財經(jīng)記者透露,本次人形機器人半程馬拉松賽的規(guī)則尚未最終確定!澳壳坝懻摰囊(guī)則可能是限時賽,也就是要求機器人在三個半小時內(nèi)完賽,看誰跑得距離更長!
根據(jù)主辦方當(dāng)前披露的規(guī)則,機器人可更換電池,也可通過更換機器人以接力形式參加全程比賽。而最終的結(jié)果則需要依據(jù)比賽過程中完賽時間、機器人更換次數(shù)進(jìn)行綜合評價,比賽過程中更換機器人每次罰時10分鐘。
“我們更傾向于用換電池。”陳春玉透露,根據(jù)目前的訓(xùn)練狀況,小麥想要完成21公里左右的比賽,需要更換兩次電池!叭绻瞧綍r走的話,小麥可以走4個小時左右,但是跑步的功率消耗更多,在2m/s的移動速度下,我們估計跑完全程確實需要超過3個小時。”
不選擇更換機器人,也是為了驗證產(chǎn)品的穩(wěn)定性。楊國棟說,對于現(xiàn)階段的機器人來說,“在視頻里跑步已經(jīng)不是什么難事”。
他告訴記者,機器人的運動控制大致可以分為三個階段,第一個階段是單一的動作序列,比如走路、跑步等,機器人需要完成的是交替邁步、雙腳騰空等基本動作。第二階段則是多動作的組合訓(xùn)練,“比如跳舞,就是將單一的手部、腳部動作組合,需要身體多個部位協(xié)同的復(fù)雜任務(wù)需求”。而第三階段則是過渡到全身的長時序運動控制,需要在更具體的場景導(dǎo)向中滿足各種任務(wù)要求。“第三階段的機器人產(chǎn)品才能達(dá)到交付客戶的水平!睏顕鴹澱f道。
“實際上,如果這個比賽在一年以前舉辦,能夠參賽的機器人還不會很多!标惔河窀嬖V第一財經(jīng)記者,在一年的時間中,國內(nèi)的技術(shù)轉(zhuǎn)向已經(jīng)基本轉(zhuǎn)至了強化學(xué)習(xí),“在某種程度上,這降低了機器人運動控制的門檻”。
跟過去傳統(tǒng)的機器人運動控制方法相比,強化學(xué)習(xí)不需要依據(jù)機器人的動力學(xué)、運動學(xué)等進(jìn)行精確建模,而是讓機器人在環(huán)境中不斷嘗試和學(xué)習(xí),自動發(fā)現(xiàn)最優(yōu)的控制策略!皬娀瘜W(xué)習(xí)可以讓機器人在模擬環(huán)境中不斷嘗試不同的動作,通過獎勵機制來找到最穩(wěn)定的方式,再進(jìn)行Sim to Real(模擬到現(xiàn)實)的遷移!标惔河裾f道。
“21公里的賽程,對于機器人來說已經(jīng)是一個比較極端的情況了!笨萍疾繃铱萍紝<抑艿细嬖V第一財經(jīng)記者,在機器人實際發(fā)展的工業(yè)、家庭場景當(dāng)中,長時間的跑步能力并不是最重要的!澳┒藞(zhí)行器的操作、更智能的大腦、穩(wěn)定的移動能力,優(yōu)先級都在跑步之前。”但對于機器人企業(yè)來說,參加半程馬拉松,也并非完全是“作秀”,“畢竟這是一個能夠真實對比機器人能力的場合,投資人、B端和C端市場,都需要對比,都需要看一看,哪家機器人的可靠性、穩(wěn)定性更好”。
一家深圳機器人公司的相關(guān)負(fù)責(zé)人告訴第一財經(jīng)記者,“由于資金人力、開發(fā)任務(wù)繁重等因素,無法及時滿足活動需求”。
或許對于人形機器人來說,是否能夠在這場比賽中獲得冠軍,并不重要。當(dāng)機器人站在起跑線,用更真實的姿態(tài)和能力跑進(jìn)更多場景,才是這場比賽的重點。
(本文來自第一財經(jīng))