過去一年,在大語言模型浪潮之下,人形機(jī)器人成為市場上為數(shù)不多的熱門賽道。但在日前舉行的世界機(jī)器人大會期間,杭州宇樹科技有限公司(以下簡稱“宇樹科技”)創(chuàng)始人、CEO王興興向包括澎湃科技在內(nèi)的媒體直言, 人形機(jī)器人最大的問題其實和大模型相似,整個機(jī)器人AI模型水平能力不夠,行業(yè)的熱度超過了行業(yè)的落地能力。在資本熱潮之下,機(jī)器人行業(yè)已經(jīng)出現(xiàn)了估值過高等亂象,他們?nèi)詫猿炙淖銠C(jī)器人和人形機(jī)器人 “兩條腿”走路,對AI保持克制。
此次世界機(jī)器人大會,宇樹科技展出了兩款已量產(chǎn)的人形機(jī)器人Unitree G1、H1和兩款四足機(jī)器狗亮相大會展區(qū)。Unitree G1于今年5月正式亮相,售價9.9萬元。王興興稱,售價9.9萬元背后的思路是想讓更多的人先把機(jī)器人用起來,不希望帶頭把行業(yè)做爛。他認(rèn)為當(dāng)前人形機(jī)器人整體市場價格還是偏高,最大的原因是技術(shù)成熟度沒有機(jī)器狗高。
宇樹科技創(chuàng)始人、CEO王興興
以下為王興興對話實錄:
做機(jī)器人是順勢而為
澎湃科技:最近Figure AI也發(fā)布了第二代人形機(jī)器人視頻,外媒評論說“硬件能力不夠”,您怎么看?
王興興:整個人形機(jī)器人行業(yè)目前硬件和軟件都還不夠成熟,現(xiàn)在只能說是剛剛起步,但發(fā)展速度包括整體進(jìn)展還算可以,沒有特別好,但至少也沒有特別壞。
澎湃科技:人形機(jī)器人、具身智能概念現(xiàn)在很火,但在早些時候,業(yè)界普遍不看好人形機(jī)器人,宇樹做人形機(jī)器人的思路是怎樣的?
王興興:雷總(雷軍,小米科技創(chuàng)始人)說過要順勢而為,要追著社會潮流去做,如果做的太早或太晚,其實都是不好的。
2020年前,有很多投資人曾問我們做不做人形機(jī)器人,當(dāng)時我非常斬釘截鐵地回答“我們不做”,但為什么2023年初我們又開始做人形機(jī)器人了呢?
不做的最大原因是當(dāng)時全球人形機(jī)器人的控制技術(shù)不是特別理想,性能上不去,看不到實用價值。但在2021年-2022年,在馬斯克的帶領(lǐng)下,全球科技對人形機(jī)器人非常關(guān)注,尤其是在2022年底大語言模型出來后,AI的技術(shù)有了質(zhì)變,大家已經(jīng)看到AI賦能機(jī)器人的潛力。
大家可能想不到,在2022年底,我們還沒做人形機(jī)器人的時候,已經(jīng)有一些客戶找我們買人形機(jī)器人。所以我們覺得那個時候社會的共識、熱度、客戶對它的期待程度已經(jīng)足夠了,于是我們從2023年正式開始做人形機(jī)器人。
人形機(jī)器人市場熱度遠(yuǎn)超行業(yè)成熟度
澎湃科技:行業(yè)內(nèi)技術(shù)迭代的速度很快,你們做人形機(jī)器人有壓力嗎?
王興興:沒有太大壓力,我們做人形機(jī)器人是順理成章的事情。原本我們只做機(jī)器狗,現(xiàn)在同樣的人做兩個產(chǎn)品,對公司來說反而是更好、更重要的一件事。機(jī)器狗和人形機(jī)器人的90%以上的硬件和軟件都類似。目前人形機(jī)器人這個行業(yè)看似挺不錯的。
技術(shù)迭代速度非?欤恐芏加忻黠@的技術(shù)進(jìn)步。我們現(xiàn)階段的產(chǎn)品主打還是在運動控制上,但工業(yè)場景也會做一些,不過目前工業(yè)有些場景不太好落地。
商業(yè)化方面我們確實不太著急,我們希望能把本體、產(chǎn)品本身做的更好時再推廣。機(jī)器人行業(yè)完全是由技術(shù)驅(qū)動的,當(dāng)你的技術(shù)能力越好,公司整體也會表現(xiàn)更好。
澎湃科技:你覺得現(xiàn)在人形機(jī)器人商業(yè)環(huán)境好嗎?
王興興:有點過熱,雖然說市場熱度高,整個商業(yè)環(huán)境會好很多,但現(xiàn)在的市場熱度遠(yuǎn)超行業(yè)實際的落地和商業(yè)化進(jìn)展,因此會出現(xiàn)一些行業(yè)亂象,比如公司估值高、公司出現(xiàn)虧損、卷入價格戰(zhàn)這些現(xiàn)象。
澎湃科技:今年國內(nèi)外不少人形機(jī)器人進(jìn)廠“打工”,你怎么看待?
王興興:進(jìn)廠是一個趨勢,近幾個月,我們與蔚來等汽車工廠合作,部署了人形機(jī)器人進(jìn)廠做搬運工作,國內(nèi)友商也在推進(jìn)類似合作。目前還處于試點階段,雖然方向有價值,但還未實現(xiàn)商業(yè)閉環(huán)。一臺機(jī)器人的成本仍高于人力,沒能夠形成正向循環(huán)的商業(yè)價值。我們并不集中在工業(yè)場景,科研、教育、AI公司和個人消費者,我們都完全歡迎。
機(jī)器人AI領(lǐng)域正處于探索階段
澎湃科技:從目前人形機(jī)器人的研發(fā)角度看,大模型可以解決哪些技術(shù)問題?主要應(yīng)用在哪些方向?大模型和人工智能的應(yīng)用有望降低研發(fā)成本嗎?
王興興:目前大模型主要指大語言模型或多模態(tài)模型,這些技術(shù)確實能用于機(jī)器人,但這只是其中的一部分。真正的機(jī)器人大模型需要的不僅是語言能力,而是執(zhí)行任務(wù)能力。比如,在工廠里工作的機(jī)器人完全可以不需要語言交流,通過照片、數(shù)字指令來完成任務(wù)。無論是在工廠擰螺絲、拆裝,還是在家中做家務(wù),機(jī)器人只要能完成任務(wù),語言能力就是次要的。如果僅僅是對話功能,手機(jī)等設(shè)備就能做好了。
目前在“干活”這個點,大語言模型確實會用到一些部分,但更重要的是構(gòu)建一個專門的機(jī)器人模型。這需要整合圖像數(shù)據(jù)、關(guān)節(jié)指令、激光雷達(dá)數(shù)據(jù)等多種信息。最近特斯拉正在招募數(shù)據(jù)采集工人,這部分訓(xùn)練更多涉及模仿學(xué)習(xí),與大語言模型的關(guān)聯(lián)不大。此外,機(jī)器人模型的結(jié)構(gòu)與大語言模型也存在差異,整體體系還不夠成熟,機(jī)器人領(lǐng)域的數(shù)據(jù)采集、對齊和處理等方面的路徑還不清晰。
在機(jī)器人智能領(lǐng)域,各家的技術(shù)路線差異很大。目前的路徑并沒有統(tǒng)一標(biāo)準(zhǔn),很難判斷哪個路線是正確的、哪個進(jìn)展更快。現(xiàn)在的機(jī)器人研發(fā)有點像大語言模型發(fā)展前的一兩年,大家意識到方向在哪里,但還沒有能明確說自己的路徑是絕對正確的。就像在GPT架構(gòu)出現(xiàn)之前,有很多不同的語言模型結(jié)構(gòu),但后來大家發(fā)現(xiàn)GPT的架構(gòu)更有價值,從而淘汰了其他模型。當(dāng)前的機(jī)器人AI領(lǐng)域也正處于這樣的探索階段。
澎湃科技:目前人形機(jī)器人在你看來,有哪些待克服的卡點問題?
王興興:人形機(jī)器人目前面臨的最大問題其實和大模型相似,整個機(jī)器人AI模型水平能力還不夠,包括AI訓(xùn)練數(shù)據(jù)集、AI產(chǎn)品落地部署,還沒有達(dá)到初代級GPT的水平,無論是四足機(jī)器人、清潔機(jī)器人還是其他類型的機(jī)器人,這是全球范圍內(nèi)的挑戰(zhàn)。
從硬件的層面來說,目前也是不夠的,雖然沒有理論上的門檻,但工程上的問題是要把成本做得更低、外觀做的更極致,硬件功能也更豐富,但硬件不是一個最大的限制。如果哪天有人把AI機(jī)器人的模型做出來,找宇樹來定制機(jī)器人,我們可以保證年底之前直接給他做10萬個人形機(jī)器人。
如果機(jī)器人的AI能力后期突破,達(dá)到某一臨界點,它們會在工廠中實現(xiàn)高效率運行,機(jī)器人的價格也會更便宜,如果能超過人力的效率,商業(yè)上也可以大規(guī)模推廣起來,這是最有價值的。
澎湃科技:你認(rèn)為通用機(jī)器人領(lǐng)域何時會迎來“iPhone時刻”?
王興興:“iPhone時刻”是個關(guān)鍵節(jié)點, “iPhone時刻”的到來不是依賴單一技術(shù)突破,而是多個技術(shù)的綜合性整合。我個人對于機(jī)器人AI領(lǐng)域持樂觀態(tài)度,目前大家覺得機(jī)器人有點“傻”,只能做一些固定任務(wù),但我認(rèn)為未來的進(jìn)展會很快。
我預(yù)計今年年底前,全球至少會有一家公司或?qū)嶒炇覍崿F(xiàn)通用型機(jī)器人AI模型,但這還不能算是真正的“iPhone時刻”。我們期待的“iPhone時刻”是機(jī)器人在工業(yè)或服務(wù)業(yè)中有實際應(yīng)用,且?guī)映鲐浟看蠓鲩L的那個節(jié)點。我認(rèn)為,這個時刻可能需要3-4年,但不會超過5年。在工廠里實現(xiàn)大規(guī)模應(yīng)用,估計還要兩三年的時間。
不希望帶頭把行業(yè)做爛
澎湃科技:您如何看待當(dāng)前智能機(jī)器人行業(yè)的競爭格局,像馬斯克、小米等公司的投入,您認(rèn)為中小公司的機(jī)會在哪里?
王興興:中小公司的機(jī)會在于保持對前沿技術(shù)的敏銳度,預(yù)判未來1-5年的技術(shù)路線和產(chǎn)品趨勢,并靈活布局,這樣才能生存。相比之下,大公司反而受制于內(nèi)部競爭、資源分配和復(fù)雜的溝通流程,反應(yīng)速度往往不如中小公司。
澎湃科技:你認(rèn)為未來機(jī)器人行業(yè)兩三年的發(fā)展方向是什么?宇樹是否會將未來業(yè)務(wù)All in到人形機(jī)器人賽道?
王興興:AI肯定是發(fā)展的大方向,但要看到底哪些AI的方向和渠道是正確的,現(xiàn)在行業(yè)很亂。我們對AI投入相對克制,因為太燒錢、燒人了。我們機(jī)器人的本體還是我們的立身之本,我其實非常感謝大家對我們的認(rèn)可,無論是認(rèn)可我們的硬件或認(rèn)可我們的軟件,我都非常感謝。
未來基于模仿學(xué)習(xí)這方面值得多關(guān)注,短期內(nèi)還是相對能出成果,而且長期來看也比較有價值。特斯拉近期在招人做數(shù)據(jù)采集來做模仿學(xué)習(xí)。數(shù)據(jù)確實是一個卡點,要重新挖掘和生產(chǎn)數(shù)據(jù)。
我們并不會All in人形機(jī)器人,我們會四足機(jī)器人和人形機(jī)器人 “兩條腿”走路,目前還是四足機(jī)器人賣的比較好。
澎湃科技:你們?yōu)槭裁磿褍r格控制在9.9萬元?
王興興:我們價格低的原因很簡單,因為做機(jī)器狗技術(shù)比較成熟,我們對發(fā)電機(jī)、機(jī)械結(jié)構(gòu)傳感器、電控系統(tǒng)芯片這些成本怎么控制,有較多的經(jīng)驗心得。我們的思路是想讓更多的人先把機(jī)器人用起來,前提就得價格比較友好,太貴了買的人比較少。
目前,整體市場人形機(jī)器人價格目前偏高,畢竟技術(shù)成熟度沒有機(jī)器狗高,成本還是會高一些。如果后續(xù)出貨量增加,價格肯定會更加親民。出貨量增大以后,價格會降低,這也是所有產(chǎn)品發(fā)展的自然趨勢。
我們不希望帶頭把這個行業(yè)做爛,我們還是希望價格相對合理,如果后續(xù)明年出貨量提升、機(jī)器人的能力越來越強(qiáng)的話,我認(rèn)為價格還是有更好的調(diào)整。