當(dāng)前位置：人工智能實驗室> 機器人 > 地表最強人形機器人問世！擎天柱頭號勁敵，每天工作20小時，前代已進寶馬打工

地表最強人形機器人問世！擎天柱頭號勁敵，每天工作20小時，前代已進寶馬打工
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-07 14:42:04 瀏覽：10668次

導(dǎo)讀：智東西（公眾號：zhidxcom）作者| 香草編輯| 心緣智東西8月7日報道，昨晚，由微軟OpenAI英偉達英特爾聯(lián)手投資的明星機器人創(chuàng)企Figure，發(fā)布了新一代機器人Figure 02，再次顛覆我們對人形機器人的想象。升級后的Figure 02不僅外形更像人，還在OpenAI多模...

智東西（公眾號：zhidxcom）

作者| 香草

編輯| 心緣

智東西8月7日報道，昨晚，由微軟OpenAI英偉達英特爾聯(lián)手投資的明星機器人創(chuàng)企Figure，發(fā)布了新一代機器人Figure 02，再次顛覆我們對人形機器人的想象。

升級后的Figure 02不僅外形更像人，還在OpenAI多模態(tài)大模型的加持下，實現(xiàn)了與人類語音對話；擁有16個自由度的第四代手部靈活度大幅提升，可以實現(xiàn)更精細的操作，而特斯拉的擎天柱二代手部自由度為11個。

與第一代相比，F(xiàn)igure 02從外觀設(shè)計、軟硬件性能，到內(nèi)置AI模型都進行了徹底的升級，主要體現(xiàn)在以下方面：6個板載相機、電池容量增加50%以上、3倍推理速度、第四代手部、語音到語音交互、內(nèi)置VLM（視覺語言模型）。

▲Figure 02

Figure成立于2022年，截至目前共完成5輪融資，總額8.54億美元（約合人民幣61.08億元），估值達到26億美元（約合人民幣185.88億元）。其投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等，涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家，陣容十分亮眼。

今年2月，F(xiàn)igure宣布與OpenAI達成合作，將在OpenAI大模型的支持下開發(fā)下一代人形機器人模型，將其多模態(tài)模型擴展到機器人的感知、推理和交互中。Figure 02的語音到語音交互功能，便是其基于OpenAI為其定制大模型的最新嘗試。

▲Figure 02在工廠中行走

Figure創(chuàng)始人兼CEO Brett Adcock稱，F(xiàn)igure 02的續(xù)航可支持每天完成約20小時的有效工作，這有助于其進入勞動力市場和家庭。值得一提的是，F(xiàn)igure的初代機器人Figure 01已經(jīng)在寶馬工廠落地，在汽車制造過程中“自動執(zhí)行困難、不安全且乏味的任務(wù)”。

從概念設(shè)計到落地，F(xiàn)igure 02僅用時18個月。Adcock還提到，團隊將推動低成本、高效率地制造，預(yù)計明年開始批量生產(chǎn)。

一、推理能力提升3倍，每天可工作20小時

從外形上看，F(xiàn)igure 02比第一代酷炫了許多，布線不再裸露在外，看起來更加完整，外骨骼為其增添了現(xiàn)代感和科技感。不得不說，F(xiàn)igure 02現(xiàn)在看起來更像特斯拉的擎天柱了。

▲Figure 01（左）、Figure 02（中）和擎天柱二代（右）外形對比

在Figure 01的基礎(chǔ)上，F(xiàn)igure對機器人的軟硬件進行了徹底的重新設(shè)計，覆蓋AI、計算機視覺、電池、電子設(shè)備、傳感器和執(zhí)行器等關(guān)鍵技術(shù)。

▲Figure 02

Figure 02在6個方面取得突破，包括語音交互、攝像頭、手部、VLM（視覺語言模型）、電池、CPU/GPU。

具體來看，F(xiàn)igure 02通過定制AI模型驅(qū)動的板載麥克風(fēng)和揚聲器，以語音到語音的方式直接與人類對話。

它的頭部、前軀干和后軀干共有6個板載RGB攝像頭，通過AI驅(qū)動的視覺系統(tǒng)感知和理解物理世界，并在內(nèi)置VLM的支持下進行快速常識性視覺推理。

▲Figure 02的6個攝像頭

Figure 02采用Figure自研的第四代手，其具備16個自由度，且力量與人類等同。

▲Figure 02手部

Figure 02內(nèi)置的電池容量為2.25 KWh，相比上一代增加了50%以上，據(jù)稱每天能夠完成約20小時的有效工作，這為人形機器人進入勞動力市場和家庭鋪平了道路。

▲Figure 02在寶馬工廠

模型推理方面，F(xiàn)igure 02板載的CPU/GPU提供比上一代高3倍的計算和推理能力，具備自我修正的學(xué)習(xí)能力。

▲Figure 02在寶馬工廠

在外骨骼的加持下，F(xiàn)igure 02的重量相比上一代有所減輕，但由于增加了電池、攝像頭、CPU/GPU等，凈重量增加到約70kg。

▲Figure 02的外骨骼細節(jié)

二、歷時18個月落地，預(yù)計明年開始量產(chǎn)

Figure創(chuàng)始人兼CEO Brett Adcock稱，F(xiàn)igure 02在2023年2月完成概念設(shè)計，從概念到成品歷時18個月。

Adcock解讀了Figure 02在語音交互、布線等方面的技術(shù)原理。Figure 02的語音交互能力是基于OpenAI為其定制的大模型實現(xiàn)的。

▲語音到語音推理

在接收到語音后，模型首先將其轉(zhuǎn)換為文字，同時，板載的VLM（視覺語言模型）基于攝像頭捕捉到的圖像和語音理解進行常識推理，然后基于推理控制機器人的行為，同時將輸出文本轉(zhuǎn)換為語音輸出。

在布線方面，F(xiàn)igure 02采用集成電源和計算布線，并設(shè)計了定制的電線端子和連接器，從而隱藏電線，并實現(xiàn)更高的可靠性、更緊密的包裝。

基于板載CPU和GPU，F(xiàn)igure 02能夠運行最新的AI模型，其推理能力達到Figure 01的3倍，能夠完全自主執(zhí)行現(xiàn)實世界中的任務(wù)。

▲Figure 02的CPU和GPU

對于Figure 02的進步，不少行業(yè)大佬和網(wǎng)友紛紛發(fā)來賀電。

英偉達高級研究經(jīng)理兼具身智能實驗室負責(zé)人Jim Fan稱：“恭喜Brett！制作高自由度靈巧手的決定絕對是正確的。”

▲Jim Fan評論

有的網(wǎng)友已經(jīng)迫不及待地想看Figure 02和馬斯克的擎天柱大戰(zhàn)2024了。

▲網(wǎng)友評論

有的網(wǎng)友則迫切地想購買一臺幫自己洗碗。

▲網(wǎng)友評論

同時，也不乏有一些質(zhì)疑的聲音出現(xiàn)。有網(wǎng)友問道：“他是否具備超級工廠的制造能力？他真的能在垂直整合方面做到精細到原子成本的程度嗎？”

Adcock很堅定地回答：“是的。我將推動低成本、高效率制造，明年開始批量生產(chǎn)。”

▲Adcock回應(yīng)成本問題

也有網(wǎng)友對Figure 02所謂的“世界上最先進的AI硬件”產(chǎn)生質(zhì)疑，稱擎天柱在7個月以前就已經(jīng)做到這些了。

▲網(wǎng)友評論

有網(wǎng)友認為Figure 02的營銷大于其真實進步：“這很酷，但靈活性顯然不足。你浪費了很多時間展示平移，而本可以給我展示更多手部操作這才是真正的訣竅，不是嗎？它把零件沖壓到位了？這是進步，但不值得你所營造的那種大肆宣傳。”

▲網(wǎng)友評論

三、成立2年估值185億，初代機器人已進寶馬打工

Figure成立于2022年，其創(chuàng)始人Brett Adcock是一位連續(xù)創(chuàng)業(yè)者，其此前創(chuàng)立的兩家公司分別實現(xiàn)IPO和以1億美元被收購。

Figure致力于開發(fā)能夠在倉儲、零售、看護等不同環(huán)境中工作，并處理各種任務(wù)的通用人形機器人。

截至目前，F(xiàn)igure共完成5輪融資，融資總額達到8.54億美元（約合人民幣61.08億元），估值26億美元（約合人民幣185.88億元）。

▲Figure融資歷程

去年10月，F(xiàn)igure發(fā)布第一款通用人形機器人Figure 01行走的視頻，此時團隊剛剛成立一年多，擁有60名工程師。

▲Figure 01行走

今年1月7日，F(xiàn)igure發(fā)布了一則Figure 01煮咖啡的視頻，并強調(diào)其使用端到端的AI系統(tǒng)，僅通過觀察人類煮咖啡，即可在10小時內(nèi)完成訓(xùn)練。

▲Figure 01煮咖啡

1月18日，F(xiàn)igure宣布與寶馬簽署商業(yè)協(xié)議，機器人Figure 01將進入寶馬工廠，在汽車制造過程中“自動執(zhí)行困難、不安全且乏味的任務(wù)”。

2月，F(xiàn)igure獲得6.75億美元高額融資，一舉躍升獨角獸，投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等，涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家，陣容十分亮眼。

▲Figure官宣融資

同時，F(xiàn)igure宣布與OpenAI、微軟達成合作，將與OpenAI合作開發(fā)下一代人形機器人模型，將其多模態(tài)模型擴展到機器人的感知、推理和交互中，并利用微軟云進行AI基礎(chǔ)設(shè)施構(gòu)建、訓(xùn)練。

半個月后，F(xiàn)igure于3月13日發(fā)布了Figure 01在OpenAI大模型加持后的進展。

在2分半的視頻中，F(xiàn)igure 01展示了如何描述自己眼前看到了什么，判斷自己眼前看到的東西相互之間有什么關(guān)聯(lián)，給饑餓的測試員找到桌子上唯一能吃的蘋果并精準(zhǔn)遞過去，進行“回憶”并對自己做過的事情給出評價，用簡單易懂的話語口頭解釋自己做事的緣由等高難度動作。

7月，F(xiàn)igure發(fā)布了一段視頻，展示其機器人在寶馬工廠訓(xùn)練的最新成果，其已經(jīng)可以在生產(chǎn)車間上從事簡單的抓取工作。

不得不說，僅看Figure 02此次發(fā)布的演示視頻，我們并不能十分明確地感知到它相對于上一代實現(xiàn)的突破，也難怪不少網(wǎng)友感到失望。

結(jié)語：人形機器人賽道再添一把火

今年年初，人形機器人一度迎來爆發(fā)式開局。從斯坦福機器人大秀廚藝做大餐，到特斯拉擎天柱化身保姆疊衣服，再到兩家創(chuàng)企的機器人比賽煮咖啡。除了Figure之外，另一家機器人企業(yè)1X也獲得OpenAI等知名投資者的巨額投資支持。

半年多過去，人形機器人的熱度有所退卻，不過Figure 02的發(fā)布又為這個賽道添了一把火。Figure 02在軟硬件諸多方面展現(xiàn)出了顯著的升級與突破，但由于演示視頻的局限性，也面臨著網(wǎng)友的質(zhì)疑與期待。

科技的進步從來不是一蹴而就，每一次的創(chuàng)新都伴隨著挑戰(zhàn)與爭議。后續(xù)Figure能否不斷優(yōu)化Figure 02，交出更亮眼的答卷，特斯拉擎天柱等同類產(chǎn)品又能否實現(xiàn)新的突破，我們將持續(xù)關(guān)注。

相關(guān)熱詞： 地表最強人形機器人問世擎天柱頭號勁敵每天工

上一篇：重磅！“地表最強”人形機器人亮相：擁有“超人”視覺，機械手靈活度媲美人類，每天打工超20小時？

下一篇：“人工智能日”創(chuàng)新獨角獸沙盒大賽總決賽落幕，挺進十強的竟然有一家文化傳媒公司？

AiLab云推薦

本月熱點

臺積電工廠奠基，但歐洲的芯片制造雄心難以實現(xiàn)

地表最強人形機器人問世！擎天柱頭號勁敵，每天工作20小時，前代已進寶馬打工
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-07 14:42:04 瀏覽：10668次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

地表最強人形機器人問世！擎天柱頭號勁敵，每天工作20小時，前代已進寶馬打工 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-07 14:42:04 瀏覽：10668次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

地表最強人形機器人問世！擎天柱頭號勁敵，每天工作20小時，前代已進寶馬打工
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-07 14:42:04 瀏覽：10668次