展會信息港展會大全

通用機(jī)器人的時(shí)代來了嗎?專訪配天機(jī)器人CTO郭濤:具身智能尚不具備完全泛化能力|對話未來科技
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-03-20 07:51:49   瀏覽:247次  

導(dǎo)讀:每經(jīng)記者:楊煜每經(jīng)編輯:楊夏在知名咨詢公司Gartner提出的技術(shù)成熟度曲線中,一項(xiàng)新技術(shù)或某種創(chuàng)新面世初期,常常會因過度渲染以致期望值不斷膨脹,直至泡沫破裂。2024年8月,人形工作機(jī)器人被Gartner評為處于技術(shù)成熟度曲線的萌芽期。但近日來,外界對人形機(jī)器人技術(shù)的期望值顯然在加速膨脹。人形機(jī)器人產(chǎn)品密集發(fā)布,資本市場數(shù)次因相關(guān)概念而躁動,媒體對人形機(jī)器人的報(bào)道 ......

每經(jīng)記者:楊煜每經(jīng)編輯:楊夏

在知名咨詢公司Gartner提出的技術(shù)成熟度曲線中,一項(xiàng)新技術(shù)或某種創(chuàng)新面世初期,常常會因過度渲染以致期望值不斷膨脹,直至泡沫破裂。2024年8月,人形工作機(jī)器人被Gartner評為處于技術(shù)成熟度曲線的萌芽期。但近日來,外界對人形機(jī)器人技術(shù)的期望值顯然在加速膨脹。

人形機(jī)器人產(chǎn)品密集發(fā)布,資本市場數(shù)次因相關(guān)概念而躁動,媒體對人形機(jī)器人的報(bào)道熱情尚未停歇然而,在熱度之下,一個(gè)有些“冰冷”的問題始終存在對于一個(gè)尚在持續(xù)發(fā)展的技術(shù)而言,這種熱情是否會帶來泡沫?而當(dāng)泡沫破裂,人形機(jī)器人行業(yè)又當(dāng)何去何從?

京城機(jī)電旗下配天機(jī)器人CTO郭濤在接受《每日經(jīng)濟(jì)新聞》記者專訪時(shí)直言,行業(yè)整體的發(fā)展需要“泡沫”,不然將永遠(yuǎn)“無人知曉”,但行業(yè)發(fā)展最終所需要的是,通過一點(diǎn)點(diǎn)啃硬骨頭,推動技術(shù)發(fā)展達(dá)到落地應(yīng)用。從應(yīng)用角度出發(fā),郭濤認(rèn)為,具身人工智能目前尚不具備完全泛化能力,在人形機(jī)器人賽道再度沸騰之際,他選擇將目光投向更現(xiàn)實(shí)的“戰(zhàn)場”。

通用機(jī)器人的時(shí)代來了嗎?專訪配天機(jī)器人CTO郭濤:具身智能尚不具備完全泛化能力|對話未來科技

配天機(jī)器人CTO郭濤圖片來源:受訪者供圖

“完全泛化”無解?通用具身智能面臨“三角制約”

人形機(jī)器人接近于人的外觀讓人們期待它們能夠真的像人類一樣解決通用泛化問題,但這一暢想的背后可能面臨一個(gè)“既要、又要、還要”的問題:一個(gè)通用具身智能意味著具備龐大的訓(xùn)練數(shù)據(jù)、優(yōu)秀的模型性能以及足夠的泛化能力,才能真正自主應(yīng)對現(xiàn)實(shí)場景的復(fù)雜任務(wù)與各種變化。

但,這可能嗎?配天機(jī)器人認(rèn)為具身智能發(fā)展中存在“三角制約”,即任務(wù)自主性、任務(wù)復(fù)雜度、變化適應(yīng)性等三大能力要求難以兼顧。

例如,傳統(tǒng)工業(yè)機(jī)器人無需人工介入,也可以處理復(fù)雜任務(wù),但需針對特定環(huán)境與特定任務(wù);自主移動機(jī)器人有較強(qiáng)的自主能力與變化適應(yīng)能力,但只能處理搬運(yùn)、清掃、檢測等簡單任務(wù);遙操作類機(jī)器人能在多種復(fù)雜環(huán)境下執(zhí)行復(fù)雜任務(wù),但需要專業(yè)人員全程手動操作。

市場對人形機(jī)器人與通用具身智能的興奮,在很大程度上源于AI(人工智能)大模型所帶來的應(yīng)用想象,當(dāng)人工智能與機(jī)器人技術(shù)結(jié)合,大模型將賦予機(jī)器人更高的智能水平與適應(yīng)能力,以及更流暢的交互體驗(yàn)。然而,靠大語言模型足以擊破具身智能的“三角制約”嗎?

郭濤提醒道,大語言模型與通用具身智能對變化適應(yīng)性的要求截然不同。郭濤舉了個(gè)例子讓人形機(jī)器人洗盤子,機(jī)體可能要應(yīng)對水溫變化、洗潔精不夠用等各種環(huán)境與任務(wù)的動態(tài)變化,但對大語言模型來說,在用戶發(fā)布任務(wù)后,模型響應(yīng)外部環(huán)境變化的能力變得非常薄弱。

通用機(jī)器人的時(shí)代來了嗎?專訪配天機(jī)器人CTO郭濤:具身智能尚不具備完全泛化能力|對話未來科技

配天機(jī)器人產(chǎn)品 圖片來源:受訪者供圖

此外,相比于大語言模型,通用具身智能的訓(xùn)練數(shù)據(jù)也要少得多。

郭濤表示,大語言模型動輒便需要萬億級tokens(詞元)的數(shù)據(jù)進(jìn)行訓(xùn)練,而全世界的互聯(lián)網(wǎng)用戶通過聊天、發(fā)圖片或者視頻,都是在為大語言模型自發(fā)貢獻(xiàn)數(shù)據(jù)量,但沒有人自發(fā)貢獻(xiàn)機(jī)器人的行為數(shù)據(jù)。尤其在工業(yè)領(lǐng)域,數(shù)據(jù)是私有的而非公開的,要獲取這類數(shù)據(jù)首先要獲取工業(yè)用戶的信任。

如何解決泛化能力與商業(yè)價(jià)值的矛盾是具身人工智能從技術(shù)展示走向商業(yè)落地的關(guān)鍵。郭濤認(rèn)為,在缺乏訓(xùn)練數(shù)據(jù)還要追求模型高性能的前提下,“現(xiàn)階段不可能出現(xiàn)泛化的具身人工智能”,但這并不意味著具身智能不是正確的方向。在人形機(jī)器人賽道再度沸騰之際,郭濤將目光投向更現(xiàn)實(shí)的“戰(zhàn)場”,“完全的泛化沒戲,但我們可以通過局部泛化,現(xiàn)階段就能實(shí)現(xiàn)商業(yè)化落地”,而這也是配天機(jī)器人一直以來的思路。

工業(yè)場景不只大規(guī)模生產(chǎn),傳統(tǒng)機(jī)器人有“盲區(qū)”

如何實(shí)現(xiàn)局部泛化?配天機(jī)器人在這個(gè)領(lǐng)域已有業(yè)務(wù)實(shí)踐。

配天機(jī)器人是國內(nèi)最早從事工業(yè)機(jī)器人研發(fā)的企業(yè)之一,產(chǎn)品可應(yīng)用于焊接、打磨拋光、分揀、切割、裝配等多種工業(yè)場景。但隨著業(yè)務(wù)發(fā)展,工業(yè)機(jī)器人面對的應(yīng)用場景已從大規(guī)模工業(yè)生產(chǎn)轉(zhuǎn)向多品種小批量生產(chǎn),而后者的需求依靠傳統(tǒng)的工業(yè)機(jī)器人難以解決。

傳統(tǒng)的工業(yè)機(jī)器人采取預(yù)編程方式,大規(guī)模生產(chǎn)模式下,一次性完成設(shè)備安裝及算法編程后,工業(yè)機(jī)器人便可針對生產(chǎn)中的某些環(huán)節(jié)連續(xù)運(yùn)行多年。但還有很多行業(yè)并非如此,例如造船業(yè),一些船舶的生產(chǎn)節(jié)奏以個(gè)位數(shù)計(jì),但用到的部件與工藝十分復(fù)雜,傳統(tǒng)的工業(yè)機(jī)器人模式需針對條件的變化逐一編程,但這樣一來,用機(jī)器替代人工的性價(jià)比也就大大降低。

除此之外,復(fù)雜裝配以及柔性物體的操作也是傳統(tǒng)工業(yè)機(jī)器人的應(yīng)用“盲區(qū)”。郭濤總結(jié)道:“凡是預(yù)編程解決不了的問題,傳統(tǒng)的機(jī)器人都做不了!边@一業(yè)務(wù)痛點(diǎn)促使配天機(jī)器人必須向具身智能探索。

配天機(jī)器人在今年年初提出,加快具身智能項(xiàng)目落地。郭濤強(qiáng)調(diào),公司發(fā)展具身智能,現(xiàn)階段以實(shí)現(xiàn)單一任務(wù)泛化為目標(biāo),因?yàn)樵诠I(yè)領(lǐng)域,單一任務(wù)泛化即可為客戶提供巨大價(jià)值。而公司主打的項(xiàng)目落地方向是焊接,這也是目前機(jī)器人的第一大應(yīng)用場景。“不需要啥都能干,我們就專注焊接這一類工藝,但什么都能焊,把這個(gè)做起來市場巨大!

在郭濤看來,發(fā)展具身智能是一個(gè)逐步蠶食的過程,從具體的場景、具體的工藝入手,一點(diǎn)一點(diǎn)鋪大應(yīng)用領(lǐng)域,“只要工具集建立起來,推進(jìn)的速度會很快”。同時(shí),也只有先通過具體場景的實(shí)踐證明,才能逐步獲取工業(yè)領(lǐng)域客戶的信任,進(jìn)而獲得更多工業(yè)數(shù)據(jù),形成良性循環(huán)。

不過,在具身智能點(diǎn)燃的新一輪市場躁動中,除了郭濤主張的漸進(jìn)式聚焦創(chuàng)新,押注“原生顛覆”的也不在少數(shù)。談及當(dāng)前行業(yè)的熱度,郭濤坦言,任何行業(yè)都會經(jīng)歷從無人知曉到泡沫式增長、突然下跌再緩慢爬起來的過程。

郭濤指出,相比于大語言模型,具身智能目前不存在相對統(tǒng)一的模型底座和行業(yè)共識,因此業(yè)內(nèi)仍在各自領(lǐng)域里“各顯神通”。Transformer的出世成為大語言模型突破的起點(diǎn),那具身智能何時(shí)會迎來統(tǒng)一的理論體系?對此,郭濤搖了搖頭,但他對此抱有信心:“因?yàn)檫@么多人都在努力,說不定哪天技術(shù)奇點(diǎn)就突破了。”

每日經(jīng)濟(jì)新聞

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港