展會信息港展會大全

地表最強人形機器人問世!擎天柱頭號勁敵,每天工作20小時,前代已進寶馬打工
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-07 14:42:04   瀏覽:10668次  

導(dǎo)讀:智東西(公眾號:zhidxcom) 作者| 香草 編輯| 心緣 智東西8月7日報道,昨晚,由微軟OpenAI英偉達英特爾聯(lián)手投資的明星機器人創(chuàng)企Figure,發(fā)布了新一代機器人Figure 02,再次顛覆我們對人形機器人的想象。 升級后的Figure 02不僅外形更像人,還在OpenAI多模...

智東西(公眾號:zhidxcom)

作者| 香草

編輯| 心緣

智東西8月7日報道,昨晚,由微軟OpenAI英偉達英特爾聯(lián)手投資的明星機器人創(chuàng)企Figure,發(fā)布了新一代機器人Figure 02,再次顛覆我們對人形機器人的想象。

升級后的Figure 02不僅外形更像人,還在OpenAI多模態(tài)大模型的加持下,實現(xiàn)了與人類語音對話;擁有16個自由度的第四代手部靈活度大幅提升,可以實現(xiàn)更精細的操作,而特斯拉的擎天柱二代手部自由度為11個。

與第一代相比,F(xiàn)igure 02從外觀設(shè)計、軟硬件性能,到內(nèi)置AI模型都進行了徹底的升級,主要體現(xiàn)在以下方面:6個板載相機、電池容量增加50%以上、3倍推理速度、第四代手部、語音到語音交互、內(nèi)置VLM(視覺語言模型)。

▲Figure 02

Figure成立于2022年,截至目前共完成5輪融資,總額8.54億美元(約合人民幣61.08億元),估值達到26億美元(約合人民幣185.88億元)。其投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等,涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家,陣容十分亮眼。

今年2月,F(xiàn)igure宣布與OpenAI達成合作,將在OpenAI大模型的支持下開發(fā)下一代人形機器人模型,將其多模態(tài)模型擴展到機器人的感知、推理和交互中。Figure 02的語音到語音交互功能,便是其基于OpenAI為其定制大模型的最新嘗試。

▲Figure 02在工廠中行走

Figure創(chuàng)始人兼CEO Brett Adcock稱,F(xiàn)igure 02的續(xù)航可支持每天完成約20小時的有效工作,這有助于其進入勞動力市場和家庭。值得一提的是,F(xiàn)igure的初代機器人Figure 01已經(jīng)在寶馬工廠落地,在汽車制造過程中“自動執(zhí)行困難、不安全且乏味的任務(wù)”。

從概念設(shè)計到落地,F(xiàn)igure 02僅用時18個月。Adcock還提到,團隊將推動低成本、高效率地制造,預(yù)計明年開始批量生產(chǎn)。

一、推理能力提升3倍,每天可工作20小時

從外形上看,F(xiàn)igure 02比第一代酷炫了許多,布線不再裸露在外,看起來更加完整,外骨骼為其增添了現(xiàn)代感和科技感。不得不說,F(xiàn)igure 02現(xiàn)在看起來更像特斯拉的擎天柱了。

▲Figure 01(左)、Figure 02(中)和擎天柱二代(右)外形對比

在Figure 01的基礎(chǔ)上,F(xiàn)igure對機器人的軟硬件進行了徹底的重新設(shè)計,覆蓋AI、計算機視覺、電池、電子設(shè)備、傳感器和執(zhí)行器等關(guān)鍵技術(shù)。

▲Figure 02

Figure 02在6個方面取得突破,包括語音交互、攝像頭、手部、VLM(視覺語言模型)、電池、CPU/GPU。

具體來看,F(xiàn)igure 02通過定制AI模型驅(qū)動的板載麥克風(fēng)和揚聲器,以語音到語音的方式直接與人類對話。

它的頭部、前軀干和后軀干共有6個板載RGB攝像頭,通過AI驅(qū)動的視覺系統(tǒng)感知和理解物理世界,并在內(nèi)置VLM的支持下進行快速常識性視覺推理。

▲Figure 02的6個攝像頭

Figure 02采用Figure自研的第四代手,其具備16個自由度,且力量與人類等同。

▲Figure 02手部

Figure 02內(nèi)置的電池容量為2.25 KWh,相比上一代增加了50%以上,據(jù)稱每天能夠完成約20小時的有效工作,這為人形機器人進入勞動力市場和家庭鋪平了道路。

▲Figure 02在寶馬工廠

模型推理方面,F(xiàn)igure 02板載的CPU/GPU提供比上一代高3倍的計算和推理能力,具備自我修正的學(xué)習(xí)能力。

▲Figure 02在寶馬工廠

在外骨骼的加持下,F(xiàn)igure 02的重量相比上一代有所減輕,但由于增加了電池、攝像頭、CPU/GPU等,凈重量增加到約70kg。

▲Figure 02的外骨骼細節(jié)

二、歷時18個月落地,預(yù)計明年開始量產(chǎn)

Figure創(chuàng)始人兼CEO Brett Adcock稱,F(xiàn)igure 02在2023年2月完成概念設(shè)計,從概念到成品歷時18個月。

Adcock解讀了Figure 02在語音交互、布線等方面的技術(shù)原理。Figure 02的語音交互能力是基于OpenAI為其定制的大模型實現(xiàn)的。

▲語音到語音推理

在接收到語音后,模型首先將其轉(zhuǎn)換為文字,同時,板載的VLM(視覺語言模型)基于攝像頭捕捉到的圖像和語音理解進行常識推理,然后基于推理控制機器人的行為,同時將輸出文本轉(zhuǎn)換為語音輸出。

在布線方面,F(xiàn)igure 02采用集成電源和計算布線,并設(shè)計了定制的電線端子和連接器,從而隱藏電線,并實現(xiàn)更高的可靠性、更緊密的包裝。

基于板載CPU和GPU,F(xiàn)igure 02能夠運行最新的AI模型,其推理能力達到Figure 01的3倍,能夠完全自主執(zhí)行現(xiàn)實世界中的任務(wù)。

▲Figure 02的CPU和GPU

對于Figure 02的進步,不少行業(yè)大佬和網(wǎng)友紛紛發(fā)來賀電。

英偉達高級研究經(jīng)理兼具身智能實驗室負責(zé)人Jim Fan稱:“恭喜Brett!制作高自由度靈巧手的決定絕對是正確的。”

▲Jim Fan評論

有的網(wǎng)友已經(jīng)迫不及待地想看Figure 02和馬斯克的擎天柱大戰(zhàn)2024了。

▲網(wǎng)友評論

有的網(wǎng)友則迫切地想購買一臺幫自己洗碗。

▲網(wǎng)友評論

同時,也不乏有一些質(zhì)疑的聲音出現(xiàn)。有網(wǎng)友問道:“他是否具備超級工廠的制造能力?他真的能在垂直整合方面做到精細到原子成本的程度嗎?”

Adcock很堅定地回答:“是的。我將推動低成本、高效率制造,明年開始批量生產(chǎn)。”

▲Adcock回應(yīng)成本問題

也有網(wǎng)友對Figure 02所謂的“世界上最先進的AI硬件”產(chǎn)生質(zhì)疑,稱擎天柱在7個月以前就已經(jīng)做到這些了。

▲網(wǎng)友評論

有網(wǎng)友認為Figure 02的營銷大于其真實進步:“這很酷,但靈活性顯然不足。你浪費了很多時間展示平移,而本可以給我展示更多手部操作這才是真正的訣竅,不是嗎?它把零件沖壓到位了?這是進步,但不值得你所營造的那種大肆宣傳。”

▲網(wǎng)友評論

三、成立2年估值185億,初代機器人已進寶馬打工

Figure成立于2022年,其創(chuàng)始人Brett Adcock是一位連續(xù)創(chuàng)業(yè)者,其此前創(chuàng)立的兩家公司分別實現(xiàn)IPO和以1億美元被收購。

Figure致力于開發(fā)能夠在倉儲、零售、看護等不同環(huán)境中工作,并處理各種任務(wù)的通用人形機器人。

截至目前,F(xiàn)igure共完成5輪融資,融資總額達到8.54億美元(約合人民幣61.08億元),估值26億美元(約合人民幣185.88億元)。

▲Figure融資歷程

去年10月,F(xiàn)igure發(fā)布第一款通用人形機器人Figure 01行走的視頻,此時團隊剛剛成立一年多,擁有60名工程師。

▲Figure 01行走

今年1月7日,F(xiàn)igure發(fā)布了一則Figure 01煮咖啡的視頻,并強調(diào)其使用端到端的AI系統(tǒng),僅通過觀察人類煮咖啡,即可在10小時內(nèi)完成訓(xùn)練。

▲Figure 01煮咖啡

1月18日,F(xiàn)igure宣布與寶馬簽署商業(yè)協(xié)議,機器人Figure 01將進入寶馬工廠,在汽車制造過程中“自動執(zhí)行困難、不安全且乏味的任務(wù)”。

2月,F(xiàn)igure獲得6.75億美元高額融資,一舉躍升獨角獸,投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等,涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家,陣容十分亮眼。

▲Figure官宣融資

同時,F(xiàn)igure宣布與OpenAI、微軟達成合作,將與OpenAI合作開發(fā)下一代人形機器人模型,將其多模態(tài)模型擴展到機器人的感知、推理和交互中,并利用微軟云進行AI基礎(chǔ)設(shè)施構(gòu)建、訓(xùn)練。

半個月后,F(xiàn)igure于3月13日發(fā)布了Figure 01在OpenAI大模型加持后的進展。

在2分半的視頻中,F(xiàn)igure 01展示了如何描述自己眼前看到了什么,判斷自己眼前看到的東西相互之間有什么關(guān)聯(lián),給饑餓的測試員找到桌子上唯一能吃的蘋果并精準(zhǔn)遞過去,進行“回憶”并對自己做過的事情給出評價,用簡單易懂的話語口頭解釋自己做事的緣由等高難度動作。

7月,F(xiàn)igure發(fā)布了一段視頻,展示其機器人在寶馬工廠訓(xùn)練的最新成果,其已經(jīng)可以在生產(chǎn)車間上從事簡單的抓取工作。

不得不說,僅看Figure 02此次發(fā)布的演示視頻,我們并不能十分明確地感知到它相對于上一代實現(xiàn)的突破,也難怪不少網(wǎng)友感到失望。

結(jié)語:人形機器人賽道再添一把火

今年年初,人形機器人一度迎來爆發(fā)式開局。從斯坦福機器人大秀廚藝做大餐,到特斯拉擎天柱化身保姆疊衣服,再到兩家創(chuàng)企的機器人比賽煮咖啡。除了Figure之外,另一家機器人企業(yè)1X也獲得OpenAI等知名投資者的巨額投資支持。

半年多過去,人形機器人的熱度有所退卻,不過Figure 02的發(fā)布又為這個賽道添了一把火。Figure 02在軟硬件諸多方面展現(xiàn)出了顯著的升級與突破,但由于演示視頻的局限性,也面臨著網(wǎng)友的質(zhì)疑與期待。

科技的進步從來不是一蹴而就,每一次的創(chuàng)新都伴隨著挑戰(zhàn)與爭議。后續(xù)Figure能否不斷優(yōu)化Figure 02,交出更亮眼的答卷,特斯拉擎天柱等同類產(chǎn)品又能否實現(xiàn)新的突破,我們將持續(xù)關(guān)注。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港