網易首頁 > 網易號 > 正文申請入駐

黃仁勛對未來十年的完整判斷，今天都講明白了

2026-06-01 18:22:46　來源: 字母榜

北京舉報

分享至

“計算就是收入、瓦特就是收入、每一個token都是收入！”

以上言論，均出自黃仁勛在GTC 2026上的演講。其內容堪稱AI時代的“時間就是金錢”。

黃仁勛表示，每瓦特產生的token越多，收入就越多。

他展示了一組數據，GitHub上的代碼提交量在2026年前幾個月增加了近三倍，全球3000萬軟件開發者創造的3萬億美元薪酬價值正在產生接近9萬億美元的生產力。

在這場GTC大會上，黃仁勛帶來了許多新玩意。

最重磅的無疑是英偉達與微軟聯手設計的AI PC，第二樣是為Agent時代打造的Vera及其完整生態，第三樣是開源大模型Nemotron 3 Ultra，第四樣是物理AI Cosmos 3以及基于它而誕生的參考人形機器人Isaac。

這些東西串起來，拼成了黃仁勛對未來十年計算模式的完整判斷。

重新定義AI PC

黃仁勛說，微軟與英偉達的合作將會重新定義AI PC這個概念。

黃仁勛在臺上展示了RTX Spark。

RTX Spark是一臺筆記本電腦，芯片叫N1X，英偉達和聯發科一起做的。里面有Blackwell RTX GPU，6144個CUDA核心，第五代Tensor Core，支持FP4精度。還有定制的20核Grace CPU，通過NVLink-C2C芯片互聯連接。配128GB統一內存，臺積電3nm工藝，700億個晶體管。

數字生物學、地震處理、天體物理等應用都可以運行。所有與CUDA相關的物理、生物學、基因組學、AI、計算機圖形應用，以及Windows的應用，都可以運行。

這臺電腦和傳統筆記本最大的區別是，它能在本地跑Agent。黃仁勛說的Agent，就是能理解你說的話、能看屏幕、能讀文件、能幫你干活的AI助手。以前這些AI都要連到云端才能用，現在可以直接在你的筆記本上跑。

黃仁勛說，過去40年你用電腦是啟動應用、點擊、輸入。現在有了RTX Spark和Windows，你只需要問，電腦就會幫你完成工作。RTX Spark把英偉達 30年積累的所有技術，CUDA、RTX、AI平臺，都放進了一顆芯片。本地Agent、前沿模型、創意工作流、RTX游戲，全都能在一臺筆記本上跑。

這就是黃仁勛手中的個人AI電腦。

微軟為RTX Spark做了深度平臺優化。

實現了工作負載配置文件調度，讓Windows調度器更高效地在所有20個核心上擴展工作負載。無論你是在查看郵件還是在本地運行Agent調試代碼，Windows調度器都會確保你從CPU獲得最佳性能和效率。

他們還啟用了微軟電源和熱管理框架，在保持涼爽的同時最大化性能和功率。

為了實現RTX Spark上高達128GB的內存，微軟提高了GPU可訪問的系統內存上限，讓高內存系統上的GPU可用內存增加，從而能夠加載更大的本地AI模型或渲染更復雜的項目。

他們還增強了Windows在統一內存系統上管理共享內存區域頁面大小的方式，確保在重負載工作負載下有更大的內存頁面可用，同時讓開發者能夠靈活優化CPU和GPU之間的內存工作負載需求。

微軟CEO薩提亞·納德拉說，他們的目標是用Windows把無限的智能送到每個家庭、每張辦公桌。。

OpenClaw和Hermes Agent這些開源Agent項目在GitHub和OpenRouter上的數據已經創了紀錄，但一直沒能大規模普及，原因是沒法在用戶的主力電腦上安全、私密地跑Agent。

英偉達和微軟合作解決了這個問題。他們做了新的Windows安全原語和英偉達 OpenShell運行時，確保Agent在用戶完全掌控下安全運行。

新的Windows提供身份、隔離、策略和端到端安全能力，用來原生構建和運行Agent。

英偉達OpenShell提供了一些自定義功能，比如讓用戶限制Agent能做什么，以及不能做什么，根據用戶的隱私策略智能地把查詢路由到本地模型，在發送到云端模型的查詢中隱藏個人信息。

Hermes Agent和OpenClaw在他們的新Windows應用里用了這套安全和隱私層。這些應用讓用戶可以輕松安全地訪問設備端Agent，這些Agent能在Windows應用里執行任務，推理跨應用工作流，生成圖像和視頻，寫插件和應用代碼，語義搜索本地文件。

黃仁勛現場演示了一個在RTX Spark上本地運行的Agent怎么幫他設計房子。Agent運行Open Shell沙盒，連接Hermes編排系統和云端Claude Sonnet。

它選地點，讀概念草圖、風格情緒板、文字需求和設計意圖。Agent用筆記本上的工具，打開Rhino為場地建模，塑造地形、退界和建筑外殼，提出建筑形式，針對成本、舒適性和質量優化。

形式定好后，Agent生成內部布局、墻體和流線，房間成形。它隨時調整，自動放置門窗和結構元素，自己發現和修正錯誤。批準后，Agent從Rhino導出模型，導入Blender，材質和對象屬性完整轉移。

它調材質，選鏡頭，Blender渲染房子。Agent用Flux模型生成多個視角和光照條件。

整個過程全部都由Agent自己完成。

這就是黃仁勛說的“新的PC”。以前你用電腦是打開軟件、點鼠標、敲鍵盤。現在你可以直接告訴Agent你要干什么，它自己去操作各種軟件完成任務。

RTX Spark不只是為Agent設計的，它也是一臺完整的創作和游戲電腦。

你可以在上面通過OptiX和DLSS渲染超大的90GB 3D場景，用Blackwell解碼器編輯12K 4:2:2視頻，跑1200億參數、100萬token上下文的大語言模型，玩1440p分辨率、超過100幀的AAA游戲，支持光線追蹤、DLSS和Reflex。

RTX Spark還會支持新的RTX能力，包括DLSS 4.5光線重建，用第二代transformer模型，會出現在Blender 5.3和幾十款游戲里。還有RTX Video 4倍幀生成，會出現在ComfyUI里。

RTX Spark是筆記本。不過黃仁勛也宣布推出桌面和工作站版本DGX Spark。

768GB內存，可以跑萬億參數的大模型，20 petaflops算力，每秒8TB內存帶寬，放在辦公桌上。如果你是大語言模型開發者或Agent開發者，可以在本地訓練和測試模型，需要部署時再把模型放到云端。

黃仁勛說，想想15到20年前的電話。今天的手機，打電話不是最常用的功能。手機的意義完全不同了。PC也會經歷類似變化。十年后的PC不會只是用來打開軟件、點鼠標的工具。

ASUS、Dell、HP、Lenovo、微軟Surface和MSI今年秋季會推出RTX Spark驅動的超薄Windows筆記本和緊湊型臺式PC，全天候電池續航和優質顯示屏。Acer和GIGABYTE的型號隨后推出。黃仁勛沒說具體價格。

Vera Rubin和AI工廠

隨后，黃仁勛宣布，Vera Rubin已經全面投入生產。

Vera Rubin是是一套五機架規模的AI超級計算機系統，專門為跑Agent設計。

第一種是Vera Rubin NVL72，負責提示理解、上下文處理、推理和規劃，這是Agent的“大腦”。

第二種是Vera CPU機架，單個液冷機架里裝256顆Vera CPU，負責協調模型、管理內存、調用工具。

第三種是Groq 3 LPX機架，256個 Groq 3 LPU橫跨16個托架，每秒40PB的SRAM 帶寬，提供超低延遲的 Token 生成。NVL72負責高吞吐，Groq LPU負責低延遲。

第四種是Vera BlueField-4 STX 存儲機架，這是Agent保存記憶的地方，負責存儲處理、加速和片上安全。

第五種是 NVIDIA Spectrum-X Ethernet CPO 網絡機架，配備共封裝光學技術的以太網交換機，200Gb/s SerDes，和臺積電合作做芯片級封裝和超高功率磷化銦激光模塊。

Vera Rubin由七顆新芯片組成。臺積電3nm制程，CoWoS-L封裝技術，HBM內存來自Micron、SK hynix和Samsung。一塊Vera Rubin計算板上有萬億級晶體管和超過18000個元件。

整個機架包含18個計算托盤、9個熱插拔NVLink交換托盤、高效液冷歧管和匯流排。液冷匯流排可以承載超過5000安培電流，相當于20臺電動汽車全速加速時的電流。總共130萬個元件構成第三代MGX機架設計。

和上一代Grace Blackwell相比，Vera Rubin在處理Agent任務時的吞吐量提升了10倍。

黃仁勛說，他們為Vera Rubin創造的供應鏈規模是Grace Blackwell的兩倍。

以前組裝一個Grace Blackwell機架需要兩小時，現在Vera Rubin只需要五分鐘。原因是設計改了。過去機架里有很多線纜和軟管，現在用PCB中板直接連接兩側，不再需要線纜、軟管和風扇。全部液冷，模塊化設計，熱插拔。

黃仁勛說，以前做Hopper時，最重要的工作是預訓練。到Grace Blackwell，重點是推理。

“很多人說推理很簡單，但推理就是錢。”

模型越來越復雜，要在高響應速度、快速交互和高吞吐下同時完成推理很困難。這就是NVLink 72的意義。

黃仁勛說，今天英偉達的token成本比競爭對手低一個數量級，因為他們做了協同設計，理解了推理的計算模式。

現在到了Agent時代，Agent不只是生成答案，它要觀察、推理、規劃、用工具，管理大量上下文，處理工作記憶和長期記憶，衍生出專家子Agent。Vera Rubin就是為這種工作才誕生的。

Vera Rubin平臺引入了英偉達 Spectrum-X以太網光子學，這是世界上第一個基于共封裝光學技術的交換機，有200Gb/s SerDes，如今已經投產。

共封裝光學是什么？

傳統網絡交換機用可插拔收發器，收發器插在交換機外面，需要額外的功率、散熱和空間。共封裝光學把光學模塊直接封裝在交換機芯片上，和臺積電合作做芯片級封裝。

這帶來三個好處。第一是能效提升5倍，因為光學模塊和芯片之間的距離縮短了，信號損耗更小。第二是AI正常運行時間延長5倍，因為減少了可插拔部件的故障點。第三是部署時間縮短三分之一，因為簡化了設計，為計算釋放了更多功率。

CoreWeave、Lambda和Oracle Cloud Infrastructure是首批采用共封裝光學網絡的合作伙伴。Lambda在博客中展示了英偉達首批共封裝光學樣品的開箱。黃仁勛說，通過簡化設計為計算釋放更多功率，英偉達共封裝光學網絡為百萬GPU AI工廠提供了基礎架構。

Vera Rubin平臺還集成了英偉達BlueField-4 DPU。

BlueField-4有高達800Gb/s速度的軟件定義網絡和內置多租戶隔離。借助英偉達 BlueField-4 Advanced Secure Trusted Resource Architecture，客戶可以簡化網絡操作，改善租戶隔離，在百萬GPU AI集群中獲得更大控制。

AI工廠越來越多地在Agent工作流中處理專有數據、受監管內容和關鍵任務模型。這需要針對共享或云環境中自主Agent定制的基礎設施安全性，因為基礎設施不能被隱式信任。

Vera Rubin平臺設計了全棧英偉達機密計算，用于機架規模的可信執行環境。Vera Rubin NVL72把Vera CPU、Rubin GPU、英偉達 NVLink網絡和安全功能結合到統一平臺中，在高速互連之間加密數據。這提供硬件級認證，確保系統防篡改。

在POD規模提供這種級別的保護還需要可編程軟件層，能在整個系統中執行、編排和調整安全策略。英偉達DOCA軟件平臺在每個Vera Rubin平臺機架和AI工廠層提供安全性，通過直接在BlueField-4硅中執行的能力保護數據、Agent、上下文內存和AI推理。

DOCA能做什么。它實現多租戶網絡隔離、零信任策略執行、運行時威脅檢測和高達800Gb/s速度的端到端加密，這些都不占用主機CPU資源，所以企業可以放心擴展AI工廠。

英偉達DSX平臺為Vera Rubin AI工廠提供完整的設計和運營基礎。DSX統一了參考設計、仿真、基礎設施軟件、設施和生態系統技術，幫助構建和運營針對最低token成本優化的節能AI工廠。

DSX是什么。黃仁勛說，全球在建設AI工廠，這是大規模基礎設施建設。AI工廠復雜度高，芯片、機架、網絡、電力、冷卻、電網，每一層都必須從端到端一起設計，因為計算就是收入。英偉達 DSX就是藍圖，是建設和運營AI工廠的參考設計，目標是高效率和高盈利能力。

DSX為Vera Rubin POD架構構建，對齊堆棧的每一層，從硅和系統到生命周期管理和多租戶操作，加快部署，提高規模運營可靠性和彈性。

Dell Technologies、HPE、Lenovo和Supermicro以及ASUS、Foxconn、GIGABYTE、Pegatron、Quanta Cloud Technology、Wistron和Wiwynn在采用英偉達 DSX來加速Vera Rubin的AI工廠建設。

DSX包含三個部分。第一是DSX Sim。Omniverse Blueprint合作伙伴可以在第一臺機架到場前就設計并驗證一座英偉達 Rubin AI工廠。他們可以規劃布局，模擬電力和冷卻，設計網絡，在數字孿生中驗證每次集成測試和每次變更。第二是DSX OS。工廠通電后，DSX OS接管運營，提供監控和修復基礎設施，把已安裝系統變成多租戶、彈性、AI就緒容量。第三是DSX Max-Q。

DSX Max-Q是什么。今天的AI工廠常常把電力過度配置40%，因為擔心峰值負載。DSX Max-Q可以讓運營商在相同電力預算下部署更多GPU。它有幾個技術。溫液冷卻可以在45攝氏度下運行，用更少的水和能源，把更多能源留給計算。動態電力分配可以把機架電力導向需要工作的地方，回收閑置瓦特。機架內部的電力平滑機制可以削平峰值電流和電涌。

貫穿整座工廠，AIAgent工作團隊會通過DSX Max-Q持續協調，平衡冷卻、電力和工作負載需求。DSX AI工廠還是彈性能量資產，可以和電網協同工作。DSX Flex能讀實時電網信號，在電網需要緩解壓力時動態調整工廠電力。

黃仁勛說，到本十年結束前會有100GW的AI工廠上線。由英偉達 DSX運營的AI工廠會以最高效率生產最低成本的token。

Vera Rubin什么時候可以買到。生產出貨從今年秋季開始。

黃仁勛說，過去英偉達是一家GPU公司。這些年來他們演進成系統公司。現在看到的是英偉達最復雜的系統。

最終客戶和合作伙伴不是想買一臺計算機，他們想建設AI工廠。

正因如此英偉達在再次轉型。技術現在延伸到基礎設施尺度。

合作伙伴包括發電、冷卻、電網供應商和工業基礎設施公司。他們在努力構建完整的堆棧，就像為GPU、Grace Blackwell、NVLink 72做的那樣。現在他們在構建完整的基礎設施系統，讓客戶可以建設AI基礎設施。

每個千兆瓦級AI工廠投入都從200億、300億美元開始，很快會達到每千兆瓦800億到1000億美元。1000億美元投入AI工廠，它必須第一次就能工作，而且必須立刻成功。

資本成本高，復雜度也高。就像設計芯片時會先在計算機里模擬芯片、再模擬整個系統一樣，現在也把AI工廠建在Omniverse里。可以在數字世界里建造這些系統，在現實世界動工前就完成驗證。

RTX是GPU，DGX是系統，現在DSX是基礎設施。

它包括系統和軟件，讓英偉達能和公司合作，把它們變成AI云。比如CoreWeave，最近它的價值已經達到數百億美元，在增長。

這些公司服務各自區域，也服務全球客戶。AI會無處不在，每家公司都會由AI驅動，每個地區都會建設自己的AI能力。它們需要完整的計算棧，硬件、軟件、庫，還有和第三方生態、第三方開發者連接的能力。

幫客戶建設和部署AI工廠很重要。原因是計算就是收入，現在計算就是利潤。沒有收入、沒有利潤就會變成虧損。黃仁勛說，這就是為什么英偉達是重要伙伴。他們創造完整基礎設施，把每件東西連接起來，進行了驗證，確保正常運轉。

time to first token更快，推理啟動更快，從推理轉向訓練也更快。每瓦產生的token比較多。因為把一切都整合起來，從頭設計、模擬整個系統，進行協同設計。可靠性也很重要。大型數據中心有數百萬條電纜和無數活動部件，要讓這些計算機和諧工作很困難。英偉達長期運行超大規模系統，這些經驗很重要。

最后是產品壽命。

幾年前Hopper時代的AI已經和今天完全不同。六年前Ampere時代還在談CNN，后來談Transformer，再后來談專家混合，現在談Agent系統。每隔幾個月軟件行業就會出現新技術。

如果架構不靈活，生態系統不豐富，資產壽命就不會長。因為全球軟件開發者都在用英偉達 CUDA，所以英偉達 CUDA生態的資產壽命會更長。也可以從成本的另一面理解，如果資產壽命長，總擁有成本就低。這就是差異。

黃仁勛說，買得越多，賺得越多。

全球的工廠和員工都在拼命工作，因為全世界都想賺錢。大家已經意識到，有用的AI到來了，可盈利的AI到來了，計算需求高得驚人，需求本身就是限制。

各種大模型

黃仁勛今天還發布了開源大模型Nemotron 3 Ultra。

Nemotron是英偉達為世界構建的專用開源模型，專門為Agent工作負載設計。

和其他開源模型不同，Nemotron不只給你模型，還給你訓練模型所用的數據。

Nemotron針對長時間推理、長時間運行的工具任務、工具使用和任務解決進行訓練，是世界上最大的長時程推理模型之一。模型、訓練腳本和數據都對你開源。黃仁勛說，這是開源模型的最佳形態，讓你可以拿走它，繼續添加數據，讓它變得更好，并成為你自己的模型。

Nemotron 3 Ultra主要有三個優勢，第一是速度快近五倍。

它是世界上第一批基于混合架構的模型之一，結合了狀態空間模型SSM與專家混合MoE。這種架構速度極快。黃仁勛說，更快意味著你能用相同成本思考更久。

第二是降低約30%運行成本。

第三是完全開源，包括模型、訓練腳本和數據。

那么Nemotron 3 Ultra到底是干嘛用的呢？黃仁勛說了這么一個案例。

他說英偉達現在做芯片太復雜了，要靠工程師一行行查、一輪輪跑驗證，太慢也太貴。

因為每顆AI芯片里有海量的晶體管，每條線路、每個邏輯門都必須嚴絲合縫，只要一個小錯誤，就可能讓整顆芯片延期幾個月。

所以英偉達和Cadence做了一個“芯片設計AI助手團隊”。

這個團隊是一組會干活的Agent。

它能讀芯片設計規格，寫或修改RTL代碼，自動生成測試用例，調用Cadence的仿真工具Xcelium跑模擬，再用Jasper做形式化驗證。發現Bug后，它還能定位問題、改代碼、再跑一遍驗證。

這里面大概是這樣分工：

Codex像項目經理，負責調度整個流程。

Nemotron像技術大腦，負責推理、判斷、推進驗證循環。

Cadence工具棧像專業儀器，負責真正跑芯片仿真和驗證。

Open Shell像安全沙箱，確保Agent在受控環境里工作，不亂改、不亂跑。

一堆專家子Agent則分別負責寫RTL、建測試平臺、跑回歸測試、調試Bug。

以前芯片驗證要工程師手動反復做，周期可能是幾周；現在英偉達想讓AI Agent自動接管一部分流程，把“寫代碼、跑仿真、找Bug、修Bug、再驗證”變成自動循環，把芯片設計驗證從幾周壓到幾小時。

與此同時，黃仁勛搬出了英偉達最前沿的物理AI Cosmos 3。

黃仁勛說，語言模型領域有很多人在做，而在物理AI方面，我們絕對是全球最強之一。“我為我們的團隊感到驕傲。”

黃仁勛說：“對于語言模型，我們可以使用互聯網上的英語和各種語言文本訓練，因為這些內容來自人類寫作和閱讀。但要為機器人構建數據，數據必須來自感知，來自機器人的視角。而世界上大多數視頻數據都是第三人稱視角，不是第一人稱視角。因此，對Agent系統、機器人系統、物理AI來說，數據是最難解決的問題。”

英偉達想解決一個問題：機器人太缺訓練數據了。

訓練語言模型，可以用互聯網上的文字；但訓練機器人不一樣。機器人要學會走路、抓東西、開車、避障、在工廠里干活，它需要理解真實世界里的空間、動作、物體和物理規律。

可問題是，真實世界的數據很難收集。你不可能讓機器人在現實里無限試錯，因為太慢、太貴，也可能有危險。

所以黃仁勛的思路是，先讓人遠程操控機器人，給它做示范。

再用Omniverse做仿真，在虛擬世界里生成更多訓練場景。

再把普通視頻里的第三人稱視角，轉換成機器人自己的第一人稱視角。

最后，用Cosmos這種世界模型，讓AI自己理解和生成物理世界的數據。

Cosmos可以理解視頻里發生了什么，也可以根據文字、圖片、視頻生成符合物理規律的新視頻。比如你給它一個場景，它可以預測下一秒會發生什么；你讓它模擬機器人抓杯子，它可以生成這個動作過程；你讓它訓練自動駕駛，它可以制造各種道路情況。

所以黃仁勛才說“計算就是數據”，以前數據只能從現實世界采集，現在可以用計算生成。只要模型足夠強，計算機就能模擬真實世界，給機器人制造大量訓練材料。

這對物理AI很重要，因為機器人需要的不是會聊天的AI，而是懂現實世界怎么運轉的AI。

基于此，英偉達做了一個“人形機器人標準套件”，叫Isaac GR00T。

為什么要做這個？因為做人形機器人太難了。一個機器人身上有很多電機、傳感器、控制系統，還要有訓練數據、仿真環境、操作系統、AI模型和部署工具。以前每個研究團隊都要從零開始拼這些東西，光搭環境就可能花幾個月，真正研究還沒開始，人已經累半死。

所以英偉達說：我們直接給大家做一個參考平臺。

這個平臺不只是一個機器人硬件，而是一整套東西：

有機器人本體；有運行機器人的Jetson Thor計算平臺；有AI模型；有仿真工具Isaac Lab；有遠程操作工具Isaac Teleop；有Omniverse和Cosmos來生成合成數據；有訓練和評估環境；有Isaac ROS負責部署到真實機器人上。

你可以把它理解成機器人界的“開發樣機+操作系統+訓練工具包”。

研究者拿到GR00T之后，不用從零開始造機器人、搭仿真、接傳感器、寫底層系統，而是可以直接開始訓練機器人做任務。比如讓機器人學會抓東西、搬運、走路、在工廠里工作。你可以用英偉達的全套組件，也可以只用其中一部分，把自己的模型、傳感器或控制系統換進去。

黃仁勛說它有25個身體自由度，每只手31個自由度，身高大約6英尺，體重150磅，就是想說明它是一個接近真人尺寸、能做復雜動作的人形機器人參考設計。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.