在CES 2025上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛帶來了一場引人注目的主題演講,揭示了AI與計(jì)算的未來發(fā)展方向。本文將詳細(xì)回顧黃仁勛的演講內(nèi)容,包括三款全新量產(chǎn)的Blackwell芯片、世界首個(gè)物理AI模型的推出,以及在機(jī)器人領(lǐng)域的三大突破。
在昨天上午開幕的 CES 2025 上,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛帶來了一場里程碑式的主題演講,揭示 AI 與計(jì)算的未來。從生成 AI 的核心 token 概念,到全新 Blackwell 架構(gòu) GPU 的發(fā)布,再到 AI 驅(qū)動(dòng)的數(shù)字化未來,這場演講將以跨領(lǐng)域的視角深刻影響整個(gè)行業(yè)。
1)從生成式 AI 到 Agentic AI:全新時(shí)代的序幕
Token 的誕生:作為生成 AI 的核心驅(qū)動(dòng)力,token 將文字轉(zhuǎn)化為知識(shí),為圖像注入生命,開啟了全新的數(shù)字表達(dá)方式。
AI 進(jìn)化路徑:從感知 AI、生成 AI 到能夠推理、規(guī)劃、行動(dòng)的 Agentic AI,AI 技術(shù)不斷跨越新高度。
Transformer 的革命:自 2018 年推出以來,這一技術(shù)重新定義了計(jì)算方式,徹底顛覆了傳統(tǒng)技術(shù)棧。
2)Blackwell GPU:突破性能極限
新一代 GeForce RTX 50 系列:基于 Blackwell 架構(gòu),擁有 920 億晶體管、4000 TOPS AI 性能和 4 PetaFLOPS 算力,是前代性能的三倍。
AI 與圖形的融合:首次實(shí)現(xiàn)可編程著色器與神經(jīng)網(wǎng)絡(luò)的結(jié)合,推出神經(jīng)紋理壓縮和材質(zhì)著色技術(shù),帶來驚艷的渲染效果。
普惠高性能:RTX 5070 筆記本以 $1299 的價(jià)格實(shí)現(xiàn) RTX 4090 性能,推動(dòng)高性能計(jì)算的普及。
3)AI 應(yīng)用的多領(lǐng)域拓展
企業(yè)級(jí) AI Agent:NVIDIA 提供工具如 Nemo 和 Llama Nemotron,幫助企業(yè)構(gòu)建自主推理的數(shù)字員工,實(shí)現(xiàn)智能化管理與服務(wù)。
Physic AI:通過 Omniverse 和 Cosmos 平臺(tái),AI 融入工業(yè)、自動(dòng)駕駛和機(jī)器人領(lǐng)域,重新定義全球制造和物流。
未來計(jì)算場景:NVIDIA 正將 AI 從云端帶到個(gè)人設(shè)備和企業(yè)內(nèi)部,覆蓋從開發(fā)者到普通用戶的所有計(jì)算需求。
以下為黃仁勛本次演講的主要內(nèi)容:
這是智慧的誕生之地,一種全新的工廠生成 token 的發(fā)電機(jī)。它是 AI 的構(gòu)建模塊,開啟了一個(gè)新領(lǐng)域,也邁出了進(jìn)入非凡世界的第一步。token 將文字轉(zhuǎn)化為知識(shí),為圖像注入生命;它們將創(chuàng)意變成視頻,幫助我們安全地導(dǎo)航任何環(huán)境;教會(huì)機(jī)器人像大師一樣移動(dòng),并激發(fā)我們用全新方式慶祝勝利。
在我們最需要的時(shí)候, token 還能帶來內(nèi)心的平靜。它們賦予數(shù)字意義,幫助我們更好地理解世界,預(yù)測潛在的危險(xiǎn),并尋找治療內(nèi)在威脅的辦法。它可以讓我們的愿景成真,修復(fù)我們失去的一切。
AI 的這一切開始于1993年,英偉達(dá)推出了第一款產(chǎn)品NV1。我們想要?jiǎng)?chuàng)造出能夠?qū)崿F(xiàn)普通計(jì)算機(jī)無法完成之事的電腦,這讓在 PC 中擁有游戲機(jī)成為可能。隨后,1999 年,英偉達(dá)發(fā)明了可編程 GPU,開啟了超過 20 年的技術(shù)進(jìn)步,現(xiàn)代計(jì)算機(jī)圖形學(xué)由此成為可能。六年后,我們推出 CUDA,通過豐富的算法表達(dá) GPU 的可編程性。這項(xiàng)技術(shù)最初難以解釋,但到 2012 年, AlexNet 的成功驗(yàn)證了 CUDA 的潛力,推動(dòng)了 AI 的突破性發(fā)展。
自那時(shí)起, AI 以驚人的速度發(fā)展。從感知 AI 到生成式 AI,再到能夠感知、推理、規(guī)劃和行動(dòng)的 Agentic AI, AI 的能力不斷提升。2018年,谷歌推出 Transformer, AI 的世界真正起飛。Transformer 不僅徹底改變了 AI 的格局,也重新定義了整個(gè)計(jì)算領(lǐng)域。我們意識(shí)到,機(jī)器學(xué)習(xí)不僅僅是一個(gè)新的應(yīng)用或商業(yè)機(jī)會(huì),而是對(duì)計(jì)算方式的根本性革新。從手動(dòng)編寫指令到用機(jī)器學(xué)習(xí)優(yōu)化神經(jīng)網(wǎng)絡(luò),技術(shù)棧的每一層都發(fā)生了巨大的變化。
如今, AI 的應(yīng)用已無處不在。無論是理解文字、圖像、聲音,還是翻譯氨基酸和物理學(xué),它都能完成。幾乎所有的AI應(yīng)用都可以歸結(jié)為三個(gè)問題:它學(xué)習(xí)了什么模態(tài)的信息?翻譯成了什么模態(tài)的信息?生成了什么模態(tài)的信息?這種基本概念推動(dòng)了 AI 驅(qū)動(dòng)的每一個(gè)應(yīng)用。
所有這些成就離不開GeForce的支持。GeForce讓 AI 走向大眾,而現(xiàn)在, AI 正回歸GeForce。借助實(shí)時(shí)光線追蹤技術(shù),我們能夠以令人驚嘆的效果渲染圖形。通過DLSS, AI 甚至可以超越幀的生成,預(yù)測未來的畫面。3300萬像素中僅有200萬像素是計(jì)算得出的,其余的由AI預(yù)測生成。這種奇跡般的技術(shù),展現(xiàn)了 AI 的強(qiáng)大能力,讓計(jì)算更加高效,也讓我們看到了未來的無限可能。
這是為什么現(xiàn)在發(fā)生了如此多令人驚嘆的事情。我們利用 GeForce 推動(dòng)了 AI 的發(fā)展,而現(xiàn)在, AI 正在徹底革新 GeForce。今天,我們宣布下一代產(chǎn)品RTX Blackwell 家族。讓我們一起來看看。
這是全新的 GeForce RTX 50 系列,基于 Blackwell 架構(gòu)。這款 GPU 是一臺(tái)性能怪獸,擁有 920 億晶體管、4000 TOPS 的 AI 性能和 4 PetaFLOPS 的 AI 算力,比上一代 Ada 架構(gòu)高出三倍。這一切都為了生成我剛才展示的那些令人驚嘆的像素。它還具備 380 光線追蹤 Teraflops,為需要計(jì)算的像素提供盡可能美麗的畫質(zhì),同時(shí)還有 125 著色 Teraflops。這款顯卡采用了 Micron 的 G7 顯存,速度達(dá)到 每秒 1.8TB,是上一代的兩倍性能。
我們現(xiàn)在可以將 AI 工作負(fù)載與計(jì)算機(jī)圖形工作負(fù)載結(jié)合起來,這一代產(chǎn)品的一個(gè)非凡特性是可編程著色器也可以處理神經(jīng)網(wǎng)絡(luò)。這使得我們發(fā)明了 神經(jīng)紋理壓縮 和 神經(jīng)材質(zhì)著色。這些技術(shù)通過 AI 學(xué)習(xí)紋理和壓縮算法,最終生成了只有 AI 才能實(shí)現(xiàn)的驚艷圖像效果。
即使在機(jī)械設(shè)計(jì)方面,這款顯卡也是一個(gè)奇跡。它采用了雙風(fēng)扇設(shè)計(jì),整個(gè)顯卡就像一個(gè)巨大的風(fēng)扇,內(nèi)部的電壓調(diào)節(jié)模塊是最先進(jìn)的。如此卓越的設(shè)計(jì)完全歸功于工程團(tuán)隊(duì)的努力。
接下來是性能對(duì)比。大家熟悉的 RTX 4090,售價(jià) $1599,是家用 PC 娛樂中心的核心投資。而現(xiàn)在,RTX 50 系列提供更高性能的同時(shí),起價(jià)僅為 $549,從 RTX 5070 到 RTX 5090,性能是 RTX 4090 的兩倍。
更令人驚嘆的是,我們將這種高性能 GPU 放進(jìn)了筆記本中。RTX 5070 筆記本售價(jià) $1299,卻具備 RTX 4090 的性能。這種設(shè)計(jì)結(jié)合了 AI 和計(jì)算機(jī)圖形技術(shù),讓高能效和高性能得以實(shí)現(xiàn)。
未來的計(jì)算機(jī)圖形學(xué)將是 神經(jīng)渲染 AI 與計(jì)算機(jī)圖形的融合。Blackwell 系列甚至可以在厚度僅 14.9 毫米的筆記本中實(shí)現(xiàn),從 RTX 5070 到 RTX 5090 的全系列產(chǎn)品都可以適配超薄筆記本。
GeForce 推動(dòng)了 AI 的普及,而現(xiàn)在 AI 反過來徹底變革了 GeForce。這是技術(shù)與智能的相互促進(jìn),我們正在邁向更高的境界。
一、AI 的三種 Scalling Law
接下來,讓我們談?wù)?AI 的發(fā)展方向。
1)預(yù)訓(xùn)練 Scalling Law
AI 行業(yè)正在加速擴(kuò)展,推動(dòng)這一進(jìn)程的是一種被稱為“Scalling Law”的強(qiáng)大模型。這一經(jīng)驗(yàn)法則由研究人員和產(chǎn)業(yè)界反復(fù)驗(yàn)證,表明訓(xùn)練數(shù)據(jù)的規(guī)模越大、模型的規(guī)模越大、計(jì)算能力投入越多,模型的能力也會(huì)越強(qiáng)。
數(shù)據(jù)的增長速度正在以指數(shù)級(jí)加快。據(jù)估計(jì),在未來幾年,人類每年生產(chǎn)的數(shù)據(jù)量將超過此前人類歷史上生產(chǎn)的總和。這些數(shù)據(jù)正變得多模態(tài)化,包括視頻、圖像和聲音等形式。這些海量數(shù)據(jù)可以用來訓(xùn)練 AI 的基礎(chǔ)知識(shí)體系,為 AI 奠定堅(jiān)實(shí)的知識(shí)基礎(chǔ)。
2)后訓(xùn)練 Scalling Law
除此之外,還有另外兩種 Scalling Law 正在興起。
第二種 Scalling Law 是“后訓(xùn)練 Scalling Law ”,它涉及技術(shù)如強(qiáng)化學(xué)習(xí)和人類反饋。通過這種方式,AI 根據(jù)人類的查詢生成答案,并從人類的反饋中不斷改進(jìn)。這種強(qiáng)化學(xué)習(xí)系統(tǒng)通過高質(zhì)量的提示,幫助 AI 精進(jìn)特定領(lǐng)域的技能,例如更擅長解決數(shù)學(xué)問題或進(jìn)行復(fù)雜推理。
AI 的未來,不僅僅是感知與生成,而是一個(gè)不斷自我完善、突破邊界的過程。它就像擁有一位導(dǎo)師或教練,在你完成任務(wù)后提供反饋。通過測試、反饋和自我改進(jìn),AI 也可以通過類似的強(qiáng)化學(xué)習(xí)和反饋機(jī)制進(jìn)步。這種后訓(xùn)練階段的強(qiáng)化學(xué)習(xí)與合成數(shù)據(jù)生成技術(shù)相結(jié)合,類似于自我練習(xí)的過程。AI 可以面對(duì)復(fù)雜且具有驗(yàn)證性的難題,例如證明定理或解決幾何問題,通過強(qiáng)化學(xué)習(xí)不斷優(yōu)化自己的答案。這種后訓(xùn)練雖然需要龐大的計(jì)算能力,但最終能夠創(chuàng)造出非凡的模型。
3)測試時(shí)間 Scalling Law
測試時(shí)間 Scalling Law 也逐漸浮現(xiàn)。這一法則在 AI 實(shí)際被使用時(shí)展現(xiàn)出獨(dú)特的潛力。AI 可以在推理時(shí)動(dòng)態(tài)分配資源,不再局限于參數(shù)優(yōu)化,而是專注于計(jì)算分配,以產(chǎn)生所需的高質(zhì)量答案。
這個(gè)過程類似于推理思考,而非直接推斷或一次性回答。AI 可以將問題拆解為多個(gè)步驟,生成多個(gè)解決方案并進(jìn)行評(píng)估,最終選擇最優(yōu)方案。這種長時(shí)間推理在提升模型能力方面效果顯。
我們已經(jīng)看到這種技術(shù)的演變,從 ChatGPT 到 GPT-4,再到如今的 Gemini Pro,所有這些系統(tǒng)都在經(jīng)歷預(yù)訓(xùn)練、后訓(xùn)練和測試時(shí)間擴(kuò)展的逐步發(fā)展。實(shí)現(xiàn)這些突破需要巨大的計(jì)算能力,而這正是 英偉達(dá)Blackwell 架構(gòu)的核心價(jià)值。
二、Blackwell 架構(gòu)最新介紹
Blackwell 系統(tǒng)正在全面生產(chǎn)中,其性能令人驚嘆。如今,每家云服務(wù)提供商都在部署這些系統(tǒng),它們由全球 45 家工廠生產(chǎn)制造,支持多達(dá) 200 種配置,包括液冷、風(fēng)冷、x86 架構(gòu)以及 英偉達(dá)Grace CPU 版本等。
其核心組件 NVLink 系統(tǒng)本身重量高達(dá) 1.5 噸,擁有 60 萬個(gè)零件,相當(dāng)于 20 輛汽車的復(fù)雜程度,背后連接了 2 英里的銅線與 5000 根電纜。整個(gè)制造過程極其復(fù)雜,但目標(biāo)是為了滿足對(duì)計(jì)算需求不斷擴(kuò)大的需求。
相比上一代架構(gòu),Blackwell 在每瓦性能上提高了 4 倍,在 每美元性能 上提高了 3 倍。這意味著,在相同成本下,訓(xùn)練模型的規(guī)模可以增加 3 倍,而這些改進(jìn)背后的關(guān)鍵是生成 AI token 。這些 token 被廣泛應(yīng)用于 ChatGPT、Gemini 和各種 AI 服務(wù)中,是未來計(jì)算的基礎(chǔ)。
在此基礎(chǔ)上,英偉達(dá)推動(dòng)了全新的計(jì)算模式:神經(jīng)渲染,將 AI 與計(jì)算機(jī)圖形學(xué)完美融合。Blackwell 架構(gòu)下的 72 塊 GPU 組成了全球最大的單芯片系統(tǒng),提供了高達(dá) 1.4 ExaFLOPS 的 AI 浮點(diǎn)性能,其內(nèi)存帶寬達(dá)到驚人的 1.2 PB/s,相當(dāng)于全球所有互聯(lián)網(wǎng)流量的總和。這種超級(jí)計(jì)算能力,使得 AI 能夠處理更復(fù)雜的推理任務(wù),同時(shí)顯著降低成本,為更高效的計(jì)算奠定了基礎(chǔ)。
三、AI Agent 系統(tǒng)與生態(tài)
展望未來,AI 的推理過程不再是簡單的單步響應(yīng),而是更接近于“內(nèi)部對(duì)話”。未來的 AI 不僅會(huì)生成答案,還會(huì)進(jìn)行反思、推理并不斷優(yōu)化。隨著 AI token 生成速率的提高和成本的降低,AI 的服務(wù)質(zhì)量將顯著提升,滿足更廣泛的應(yīng)用需求。
為幫助企業(yè)構(gòu)建具有自主推理能力的 AI 系統(tǒng),英偉達(dá)提供了三個(gè)關(guān)鍵工具:英偉達(dá)NeMo、AI 微服務(wù) 和 加速庫。通過將復(fù)雜的 CUDA 軟件和深度學(xué)習(xí)模型打包成容器化服務(wù),企業(yè)可以在任意云平臺(tái)部署這些 AI 模型,快速開發(fā)面向特定領(lǐng)域的 AI Agent ,例如支持企業(yè)管理的服務(wù)工具或用戶交互的數(shù)字員工。
這些模型為企業(yè)開辟了新的可能性,不僅降低了 AI 應(yīng)用的開發(fā)門檻,還推動(dòng)了整個(gè)行業(yè)在 Agentic AI(自主 AI)的方向上邁出堅(jiān)實(shí)的一步。未來的 AI 將成為數(shù)字員工,可以輕松集成到 SAP、ServiceNow 等企業(yè)工具中,在不同環(huán)境中為客戶提供智能服務(wù)。這是 AI 擴(kuò)展的下一個(gè)里程碑,也是 英偉達(dá)技術(shù)生態(tài)系統(tǒng)的核心愿景。
訓(xùn)練評(píng)估系統(tǒng)。未來,這些 AI Agent 人本質(zhì)上是與員工并肩工作、為您完成任務(wù)的數(shù)字化勞動(dòng)力。因此,引入這些專業(yè)化的 Agent 人到您的公司,就像為新員工辦理入職一樣。我們提供不同的工具庫,幫助這些 AI Agent 人學(xué)習(xí)公司獨(dú)特的語言、詞匯、業(yè)務(wù)流程以及工作方式。您需要向他們提供工作成果的示例,他們會(huì)嘗試生成,然后您可以提供反饋、進(jìn)行評(píng)估等等。同時(shí),您也會(huì)設(shè)置限制,比如明確他們不能執(zhí)行哪些操作、不能說什么,并控制他們可以訪問的信息。這整個(gè)數(shù)字員工流程被稱為 Nemo。某種程度上,每個(gè)公司的 IT 部門將成為 AI Agent 人的 HR 部門。
如今,IT 部門管理并維護(hù)大量軟件;未來,他們將管理、培養(yǎng)、入職并改進(jìn)大量數(shù)字 Agent 人,為公司提供服務(wù)。因此,IT 部門將逐漸演變?yōu)?AI Agent 人的 HR 部門。
此外,我們提供許多開源的藍(lán)圖供生態(tài)系統(tǒng)使用。用戶可以自由修改這些藍(lán)圖。我們?yōu)楦鞣N不同類型的 Agent 人提供了藍(lán)圖。今天,我們也宣布了一件非常酷且聰明的事情:我們推出了一個(gè)基于 Llama 的全新模型家族,即 英偉達(dá)Llama Nemo Tron 語言基礎(chǔ)模型系列。
Llama 3.1 是一個(gè)現(xiàn)象級(jí)的模型。Meta 的 Llama 3.1 下載量達(dá)到約 350,650,000 次,并衍生出了大約 60,000 種其他模型。這是推動(dòng)幾乎所有企業(yè)和行業(yè)開始研究 AI 的核心原因之一。我們意識(shí)到 Llama 模型可以為企業(yè)用例進(jìn)行更好的微調(diào)。利用我們的專業(yè)知識(shí)和能力,我們將其微調(diào)為 Llama Nemotron 開放模型套件。
這些模型分為不同大小:小型模型響應(yīng)快速;主流的超級(jí)模型 Super Llama Nemotron 是常規(guī)用途模型;而超大型模型 Ultra Model 則可作為教師模型,用于評(píng)估其他模型、生成答案并決定其質(zhì)量,或用作知識(shí)蒸餾模型。所有這些模型現(xiàn)已上線。
這些模型表現(xiàn)卓越,在對(duì)話、指令和信息檢索等領(lǐng)域的排行榜上名列前茅,非常適合全球范圍內(nèi)的 AI Agent 功能。
我們與生態(tài)系統(tǒng)的合作也十分緊密,例如與 ServiceNow、SAP、Siemens 在工業(yè) AI 方面的合作。Cadence 和 Perplexity 等公司也在開展出色的項(xiàng)目。Perplexity 顛覆了搜索領(lǐng)域,Codium 則服務(wù)于全球 3,000 萬軟件工程師。AI 助手將極大提高軟件開發(fā)人員的生產(chǎn)力,這是 AI 服務(wù)的下一個(gè)巨大應(yīng)用領(lǐng)域。全球有 10 億知識(shí)工作者,AI Agent 可能是下一個(gè)機(jī)器人行業(yè),潛力達(dá)到數(shù)萬億美元。
四、AI Agent 藍(lán)圖
接下來展示一些與合作伙伴共同完成的 AI Agent 藍(lán)圖。
AI Agent 是新的數(shù)字勞動(dòng)力,能夠協(xié)助或代替人類完成任務(wù)。英偉達(dá)的 Agentic AI 構(gòu)建模塊、NEM 預(yù)訓(xùn)練模型和 Nemo 框架,幫助組織輕松開發(fā)并部署 AI Agent 。這些 Agent 可被訓(xùn)練為領(lǐng)域特定的任務(wù)專家。
以下是四個(gè)示例:
研究助理 Agent :能夠閱讀復(fù)雜文件,如講座、期刊、財(cái)務(wù)報(bào)告等,并生成交互式播客,便于學(xué)習(xí);
軟件安全 AI Agent :幫助開發(fā)者持續(xù)掃描軟件漏洞,并提示采取相應(yīng)措施;
虛擬實(shí)驗(yàn)室 AI Agent :加速化合物設(shè)計(jì)與篩選,快速找到潛在藥物候選者;
視頻分析 AI Agent :基于 英偉達(dá)Metropolis 藍(lán)圖,分析來自數(shù)十億攝像頭的數(shù)據(jù),生成交互式搜索、摘要和報(bào)告。例如,監(jiān)控交通流量、設(shè)施流程,提供改進(jìn)建議等;
五、物理 AI 時(shí)代的到來
我們希望將 AI 從云端帶到每個(gè)角落,包括公司內(nèi)部和個(gè)人 PC。英偉達(dá)正努力將 Windows WSL 2(Windows 子系統(tǒng))轉(zhuǎn)變?yōu)橹С?AI 的首選平臺(tái)。這將使開發(fā)者和工程師更便捷地利用 英偉達(dá)的 AI 技術(shù)棧,包括語言模型、圖像模型、動(dòng)畫模型等。
此外,英偉達(dá)推出了 Cosmos,首個(gè)物理世界基礎(chǔ)模型開發(fā)平臺(tái),專注于理解物理世界的動(dòng)態(tài)特性,例如重力、摩擦、慣性、空間關(guān)系、因果關(guān)系等。它可以生成符合物理規(guī)律的視頻、場景,廣泛應(yīng)用于機(jī)器人、工業(yè) AI 和多模態(tài)語言模型的訓(xùn)練與驗(yàn)證。
Cosmos 通過連接 英偉達(dá)Omniverse 提供物理仿真,生成真實(shí)可信的模擬結(jié)果。這種結(jié)合是機(jī)器人和工業(yè)應(yīng)用開發(fā)的核心技術(shù)。
英偉達(dá)的工業(yè)戰(zhàn)略基于三個(gè)計(jì)算系統(tǒng):
用于訓(xùn)練 AI 的 DGX 系統(tǒng);
部署 AI 的 AGX 系統(tǒng);
數(shù)字孿生系統(tǒng),用于強(qiáng)化學(xué)習(xí)和 AI 優(yōu)化;
通過這三個(gè)系統(tǒng)的協(xié)同工作,英偉達(dá)推動(dòng)了機(jī)器人和工業(yè) AI 的發(fā)展,構(gòu)建了未來的數(shù)字化世界與其說這是一個(gè)三體問題,我們有一個(gè)“三計(jì)算機(jī)”解決方案。
英偉達(dá)的機(jī)器人愿景讓我給您展示三個(gè)例子。
1)工業(yè)可視化的應(yīng)用
目前,全球有數(shù)百萬工廠和數(shù)十萬個(gè)倉庫,它們構(gòu)成了價(jià)值 50 萬億美元制造業(yè)的骨干。未來,這一切都需要實(shí)現(xiàn)軟件定義和自動(dòng)化,并融入機(jī)器人技術(shù)。我們與全球領(lǐng)先的倉庫自動(dòng)化解決方案提供商 Keon,以及全球最大的專業(yè)服務(wù)提供商 Accenture 合作,專注于數(shù)字化制造,共同創(chuàng)造一些非常特別的解決方案。我們的市場推廣方式與其他軟件和技術(shù)平臺(tái)類似,通過開發(fā)者和生態(tài)系統(tǒng)合作伙伴進(jìn)行,并且越來越多的生態(tài)伙伴接入了 Omniverse 平臺(tái)。這是因?yàn)槊總(gè)人都希望可視化工業(yè)的未來。在這 50 萬億美元的全球 GDP 中,有如此多的浪費(fèi),也有如此多的自動(dòng)化機(jī)會(huì)。
來看 Keon 和 Accenture 與我們合作的這個(gè)示例:
Keon(供應(yīng)鏈解決方案公司)、Accenture(全球?qū)I(yè)服務(wù)領(lǐng)軍者)和 英偉達(dá)正將物理 AI 引入價(jià)值萬億美元的倉庫和配送中心市場。管理高效的倉庫物流需要應(yīng)對(duì)復(fù)雜的決策網(wǎng)絡(luò),這些決策受到不斷變化的變量影響,例如每日及季節(jié)性需求變化、空間限制、勞動(dòng)力供應(yīng),以及多樣化機(jī)器人和自動(dòng)化系統(tǒng)的整合。今天,要預(yù)測物理倉庫的運(yùn)營關(guān)鍵績效指標(biāo)(KPIs)幾乎是不可能的。
為了解決這些問題,Keon 正在采用 Mega(一個(gè) 英偉達(dá)Omniverse 藍(lán)圖)來構(gòu)建工業(yè)數(shù)字孿生,以測試和優(yōu)化機(jī)器人車隊(duì)。首先,Keon 的倉庫管理解決方案將任務(wù)分配給數(shù)字孿生中的工業(yè) AI 大腦,例如將貨物從緩沖區(qū)位置移動(dòng)到穿梭存儲(chǔ)解決方案。機(jī)器人車隊(duì)在 Omniverse 中的物理倉庫模擬環(huán)境中,通過感知和推理執(zhí)行任務(wù),規(guī)劃下一步動(dòng)作并采取行動(dòng)。數(shù)字孿生環(huán)境使用傳感器模擬,讓機(jī)器人大腦可以看到任務(wù)執(zhí)行后的狀態(tài),并決定接下來的動(dòng)作。在 Mega 的精確追蹤下,整個(gè)循環(huán)持續(xù)進(jìn)行,同時(shí)測量操作 KPI,如吞吐量、效率和利用率,所有這些都在對(duì)物理倉庫進(jìn)行改動(dòng)之前完成。
借助 英偉達(dá)的合作,Keon 和 Accenture 正在重新定義工業(yè)自治的未來。
未來,每個(gè)工廠都將擁有一個(gè)數(shù)字孿生,這個(gè)數(shù)字孿生與實(shí)際工廠完全同步。您可以利用 Omniverse 和 Cosmos 生成大量未來場景,AI 將決定最優(yōu)的 KPI 場景,并將其作為實(shí)際工廠部署的約束條件和 AI 編程邏輯。
2)自動(dòng)駕駛汽車
自動(dòng)駕駛革命已經(jīng)到來。經(jīng)過多年的發(fā)展,無論是 Waymo 還是 Tesla 的成功,都證明了自動(dòng)駕駛技術(shù)的成熟。我們的解決方案為這一行業(yè)提供了三種計(jì)算機(jī)系統(tǒng):用于訓(xùn)練 AI 的系統(tǒng)(如 DGX 系統(tǒng))、用于模擬測試和生成合成數(shù)據(jù)的系統(tǒng)(如 Omniverse 和 Cosmos),以及車內(nèi)的計(jì)算機(jī)系統(tǒng)(如 AGX 系統(tǒng))。全球幾乎所有主要汽車公司都在與我們合作,包括 Waymo、Zoox、Tesla,以及世界最大的電動(dòng)車公司 BYD。還有即將推出創(chuàng)新車型的 Mercedes、Lucid、Rivian、小米和沃爾沃等公司。Aurora 則正在使用 英偉達(dá)技術(shù)開發(fā)自動(dòng)駕駛卡車。
每年有 1 億輛汽車制造,全球道路上有 10 億輛汽車行駛,每年行駛總里程高達(dá)萬億英里。這些將逐漸實(shí)現(xiàn)高度自動(dòng)化或完全自動(dòng)化。這一行業(yè)預(yù)計(jì)將成為首個(gè)價(jià)值數(shù)萬億美元的機(jī)器人行業(yè)。
今天,我們宣布推出下一代車載計(jì)算機(jī) Thor。它是一個(gè)通用機(jī)器人計(jì)算機(jī),能夠處理攝像頭、高分辨率雷達(dá)、激光雷達(dá)等傳感器的大量數(shù)據(jù)。Thor 是目前行業(yè)標(biāo)準(zhǔn) Orin 的升級(jí)版,計(jì)算能力是其 20 倍,現(xiàn)已全面量產(chǎn)。同時(shí),英偉達(dá)的 Drive OS 是首個(gè)被認(rèn)證達(dá)到功能安全最高標(biāo)準(zhǔn)(ISO 26262 ASIL D)的 AI 計(jì)算機(jī)操作系統(tǒng)。
自動(dòng)駕駛數(shù)據(jù)工廠
英偉達(dá)利用 Omniverse AI 模型和 Cosmos 平臺(tái)創(chuàng)建自動(dòng)駕駛數(shù)據(jù)工廠,通過合成駕駛場景大幅擴(kuò)展訓(xùn)練數(shù)據(jù)。這包括:
OmniMap:融合地圖和地理空間數(shù)據(jù),構(gòu)建可駕駛的 3D 環(huán)境;
神經(jīng)重建引擎:利用傳感器日志生成高保真的 4D 仿真環(huán)境,并為訓(xùn)練數(shù)據(jù)生成場景變體;
Edify 3DS:從資產(chǎn)庫搜索或生成新的資產(chǎn),創(chuàng)建用于仿真的場景。
通過這些技術(shù),我們將幾千次的駕駛場景擴(kuò)展為數(shù)十億英里的數(shù)據(jù),用于更安全、更先進(jìn)的自動(dòng)駕駛系統(tǒng)的開發(fā)。
3)通用機(jī)器人
通用機(jī)器人的時(shí)代即將到來。推動(dòng)這一領(lǐng)域突破的關(guān)鍵在于訓(xùn)練。對(duì)于人形機(jī)器人來說,模仿數(shù)據(jù)的獲取相對(duì)困難,但 英偉達(dá)的 Isaac Groot 提供了解決方案。它通過模擬生成海量數(shù)據(jù)集,并結(jié)合 Omniverse 和 Cosmos 的多宇宙仿真引擎,進(jìn)行政策訓(xùn)練、驗(yàn)證和部署。
例如,開發(fā)者可以通過 Apple Vision Pro 遠(yuǎn)程操作機(jī)器人,捕捉數(shù)據(jù)而無需實(shí)體機(jī)器人,并在無風(fēng)險(xiǎn)環(huán)境中教學(xué)任務(wù)動(dòng)作。通過 Omniverse 的領(lǐng)域隨機(jī)化和 3D 到真實(shí)場景擴(kuò)展功能,生成指數(shù)級(jí)增長的數(shù)據(jù)集,為機(jī)器人學(xué)習(xí)提供海量資源。
總之,無論是工業(yè)可視化、自動(dòng)駕駛,還是通用機(jī)器人,英偉達(dá)的技術(shù)正引領(lǐng)物理 AI 和機(jī)器人領(lǐng)域的未來變革。
最后,我還有一個(gè)重要的內(nèi)容想展示,所有這些都離不開我們十年前在公司內(nèi)部啟動(dòng)的一個(gè)名為 Project Digits 的項(xiàng)目,完整名稱為 Deep Learning GPU Intelligence Training System(深度學(xué)習(xí) GPU 智能訓(xùn)練系統(tǒng)),簡稱 Digits。
在正式發(fā)布之前,我們對(duì) DGX 進(jìn)行了調(diào)整,使其與公司內(nèi)部的 RTX、AGX、OVX 以及其他系列產(chǎn)品和諧一致。DGX1 的問世真正改變了 AI 的發(fā)展方向,而這也是 英偉達(dá)對(duì) AI 發(fā)展的一個(gè)里程碑。
六、DGX1 的革命性
DGX1 的初衷是為研究人員和初創(chuàng)企業(yè)提供開箱即用的 AI 超級(jí)計(jì)算機(jī)。想象一下,以往的超級(jí)計(jì)算機(jī)需要用戶建造專屬設(shè)施,設(shè)計(jì)和打造復(fù)雜的基礎(chǔ)設(shè)施,才能實(shí)現(xiàn)其存在。而 DGX1 則是一臺(tái)專門為 AI 開發(fā)設(shè)計(jì)的超級(jí)計(jì)算機(jī),無需復(fù)雜操作,開箱即可使用。
我還記得,2016 年我將第一臺(tái) DGX1 交付給一家初創(chuàng)公司 OpenAI。當(dāng)時(shí),埃隆馬斯克(Elon Musk)、伊利亞蘇茨科維爾(Ilya Sutskever)以及 英偉達(dá)的許多工程師都在場,我們共同慶祝 DGX1 的到來。這臺(tái)設(shè)備顯著推動(dòng)了 AI 計(jì)算的發(fā)展。
如今, AI 已經(jīng)無處不在。不僅限于研究機(jī)構(gòu)和初創(chuàng)企業(yè)實(shí)驗(yàn)室,正如我一開始提到的, AI 已經(jīng)成為一種全新的計(jì)算方式和軟件開發(fā)方式。每一位軟件工程師、創(chuàng)意藝術(shù)家,甚至是使用電腦工具的普通用戶,都需要一個(gè) AI 超級(jí)計(jì)算機(jī)。但我一直希望 DGX1 能夠更小一些。
七、最新 AI 超級(jí)計(jì)算機(jī)
以下是 英偉達(dá)最新的 AI 超級(jí)計(jì)算機(jī)。它仍然屬于 Project Digits,目前我們還在尋找更好的命名,歡迎大家提供建議。這是一臺(tái)真正令人驚嘆的設(shè)備。
這款超級(jí)計(jì)算機(jī)可以運(yùn)行 英偉達(dá)的完整 AI 軟件棧,包括 DGX Cloud。它既可以用作云端超級(jí)計(jì)算機(jī),也可以作為一臺(tái)高性能的工作站,甚至是放在桌面上的分析工作站。最重要的是,它基于我們秘密開發(fā)的一款新芯片,代號(hào) GB110,這是我們制造的最小型 Grace Blackwell。
我手里有一塊芯片,給大家展示一下它的內(nèi)部設(shè)計(jì)。這款芯片是與全球領(lǐng)先的 SoC 公司 聯(lián)發(fā)科(MediaTek) 合作開發(fā)的。該 CPU SoC 專為 英偉達(dá)定制,使用 NVLink 芯片對(duì)芯片互連技術(shù)連接到 Blackwell GPU。這個(gè)小型芯片現(xiàn)在已經(jīng)全面投產(chǎn)。我們預(yù)計(jì)這款超級(jí)計(jì)算機(jī)將在 5 月 左右正式上市
我們甚至提供了“雙倍算力”的配置,可以將這些設(shè)備通過 ConnectX 連接在一起,支持 GPU 直通(GPUDirect)技術(shù)。它是一套完整的超級(jí)計(jì)算解決方案,能夠滿足 AI 開發(fā)、分析工作和工業(yè)應(yīng)用的各種需求。
此外,還宣布了三款全新 Blackwell 系統(tǒng)的芯片量產(chǎn)、世界首個(gè)物理 AI 基礎(chǔ)模型以及三大機(jī)器人領(lǐng)域的突破 自主 AI Agent 機(jī)器人、人形機(jī)器人和自動(dòng)駕駛汽車。
本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號(hào):【有新Newin】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。