![]()
“計算就是收入、瓦特就是收入、每一個token都是收入!”
以上言論,均出自黃仁勛在GTC 2026上的演講。其內容堪稱AI時代的“時間就是金錢”。
黃仁勛表示,每瓦特產生的token越多,收入就越多。
他展示了一組數據,GitHub上的代碼提交量在2026年前幾個月增加了近三倍,全球3000萬軟件開發者創造的3萬億美元薪酬價值正在產生接近9萬億美元的生產力。
![]()
在這場GTC大會上,黃仁勛帶來了許多新玩意。
最重磅的無疑是英偉達與微軟聯手設計的AI PC,第二樣是為Agent時代打造的Vera及其完整生態,第三樣是開源大模型Nemotron 3 Ultra,第四樣是物理AI Cosmos 3以及基于它而誕生的參考人形機器人Isaac。
這些東西串起來,拼成了黃仁勛對未來十年計算模式的完整判斷。
01
重新定義AI PC
黃仁勛說,微軟與英偉達的合作將會重新定義AI PC這個概念。
黃仁勛在臺上展示了RTX Spark。
RTX Spark是一臺筆記本電腦,芯片叫N1X,英偉達和聯發科一起做的。里面有Blackwell RTX GPU,6144個CUDA核心,第五代Tensor Core,支持FP4精度。還有定制的20核Grace CPU,通過NVLink-C2C芯片互聯連接。配128GB統一內存,臺積電3nm工藝,700億個晶體管。
數字生物學、地震處理、天體物理等應用都可以運行。所有與CUDA相關的物理、生物學、基因組學、AI、計算機圖形應用,以及Windows的應用,都可以運行。
![]()
這臺電腦和傳統筆記本最大的區別是,它能在本地跑Agent。黃仁勛說的Agent,就是能理解你說的話、能看屏幕、能讀文件、能幫你干活的AI助手。以前這些AI都要連到云端才能用,現在可以直接在你的筆記本上跑。
黃仁勛說,過去40年你用電腦是啟動應用、點擊、輸入。現在有了RTX Spark和Windows,你只需要問,電腦就會幫你完成工作。RTX Spark把英偉達 30年積累的所有技術,CUDA、RTX、AI平臺,都放進了一顆芯片。本地Agent、前沿模型、創意工作流、RTX游戲,全都能在一臺筆記本上跑。
這就是黃仁勛手中的個人AI電腦。
微軟為RTX Spark做了深度平臺優化。
實現了工作負載配置文件調度,讓Windows調度器更高效地在所有20個核心上擴展工作負載。無論你是在查看郵件還是在本地運行Agent調試代碼,Windows調度器都會確保你從CPU獲得最佳性能和效率。
他們還啟用了微軟電源和熱管理框架,在保持涼爽的同時最大化性能和功率。
為了實現RTX Spark上高達128GB的內存,微軟提高了GPU可訪問的系統內存上限,讓高內存系統上的GPU可用內存增加,從而能夠加載更大的本地AI模型或渲染更復雜的項目。
他們還增強了Windows在統一內存系統上管理共享內存區域頁面大小的方式,確保在重負載工作負載下有更大的內存頁面可用,同時讓開發者能夠靈活優化CPU和GPU之間的內存工作負載需求。
微軟CEO薩提亞·納德拉說,他們的目標是用Windows把無限的智能送到每個家庭、每張辦公桌。。
OpenClaw和Hermes Agent這些開源Agent項目在GitHub和OpenRouter上的數據已經創了紀錄,但一直沒能大規模普及,原因是沒法在用戶的主力電腦上安全、私密地跑Agent。
英偉達和微軟合作解決了這個問題。他們做了新的Windows安全原語和英偉達 OpenShell運行時,確保Agent在用戶完全掌控下安全運行。
新的Windows提供身份、隔離、策略和端到端安全能力,用來原生構建和運行Agent。
英偉達OpenShell提供了一些自定義功能,比如讓用戶限制Agent能做什么,以及不能做什么,根據用戶的隱私策略智能地把查詢路由到本地模型,在發送到云端模型的查詢中隱藏個人信息。
Hermes Agent和OpenClaw在他們的新Windows應用里用了這套安全和隱私層。這些應用讓用戶可以輕松安全地訪問設備端Agent,這些Agent能在Windows應用里執行任務,推理跨應用工作流,生成圖像和視頻,寫插件和應用代碼,語義搜索本地文件。
黃仁勛現場演示了一個在RTX Spark上本地運行的Agent怎么幫他設計房子。Agent運行Open Shell沙盒,連接Hermes編排系統和云端Claude Sonnet。
它選地點,讀概念草圖、風格情緒板、文字需求和設計意圖。Agent用筆記本上的工具,打開Rhino為場地建模,塑造地形、退界和建筑外殼,提出建筑形式,針對成本、舒適性和質量優化。
形式定好后,Agent生成內部布局、墻體和流線,房間成形。它隨時調整,自動放置門窗和結構元素,自己發現和修正錯誤。批準后,Agent從Rhino導出模型,導入Blender,材質和對象屬性完整轉移。
它調材質,選鏡頭,Blender渲染房子。Agent用Flux模型生成多個視角和光照條件。
整個過程全部都由Agent自己完成。
這就是黃仁勛說的“新的PC”。以前你用電腦是打開軟件、點鼠標、敲鍵盤。現在你可以直接告訴Agent你要干什么,它自己去操作各種軟件完成任務。
RTX Spark不只是為Agent設計的,它也是一臺完整的創作和游戲電腦。
你可以在上面通過OptiX和DLSS渲染超大的90GB 3D場景,用Blackwell解碼器編輯12K 4:2:2視頻,跑1200億參數、100萬token上下文的大語言模型,玩1440p分辨率、超過100幀的AAA游戲,支持光線追蹤、DLSS和Reflex。
RTX Spark還會支持新的RTX能力,包括DLSS 4.5光線重建,用第二代transformer模型,會出現在Blender 5.3和幾十款游戲里。還有RTX Video 4倍幀生成,會出現在ComfyUI里。
RTX Spark是筆記本。不過黃仁勛也宣布推出桌面和工作站版本DGX Spark。
![]()
768GB內存,可以跑萬億參數的大模型,20 petaflops算力,每秒8TB內存帶寬,放在辦公桌上。如果你是大語言模型開發者或Agent開發者,可以在本地訓練和測試模型,需要部署時再把模型放到云端。
黃仁勛說,想想15到20年前的電話。今天的手機,打電話不是最常用的功能。手機的意義完全不同了。PC也會經歷類似變化。十年后的PC不會只是用來打開軟件、點鼠標的工具。
ASUS、Dell、HP、Lenovo、微軟Surface和MSI今年秋季會推出RTX Spark驅動的超薄Windows筆記本和緊湊型臺式PC,全天候電池續航和優質顯示屏。Acer和GIGABYTE的型號隨后推出。黃仁勛沒說具體價格。
02
Vera Rubin和AI工廠
隨后,黃仁勛宣布,Vera Rubin已經全面投入生產。
Vera Rubin是是一套五機架規模的AI超級計算機系統,專門為跑Agent設計。
![]()
第一種是Vera Rubin NVL72,負責提示理解、上下文處理、推理和規劃,這是Agent的“大腦”。
第二種是Vera CPU機架,單個液冷機架里裝256顆Vera CPU,負責協調模型、管理內存、調用工具。
第三種是Groq 3 LPX機架,256個 Groq 3 LPU橫跨16個托架,每秒40PB的SRAM 帶寬,提供超低延遲的 Token 生成。NVL72負責高吞吐,Groq LPU負責低延遲。
第四種是Vera BlueField-4 STX 存儲機架,這是Agent保存記憶的地方,負責存儲處理、加速和片上安全。
第五種是 NVIDIA Spectrum-X Ethernet CPO 網絡機架,配備共封裝光學技術的以太網交換機,200Gb/s SerDes,和臺積電合作做芯片級封裝和超高功率磷化銦激光模塊。
Vera Rubin由七顆新芯片組成。臺積電3nm制程,CoWoS-L封裝技術,HBM內存來自Micron、SK hynix和Samsung。一塊Vera Rubin計算板上有萬億級晶體管和超過18000個元件。
整個機架包含18個計算托盤、9個熱插拔NVLink交換托盤、高效液冷歧管和匯流排。液冷匯流排可以承載超過5000安培電流,相當于20臺電動汽車全速加速時的電流。總共130萬個元件構成第三代MGX機架設計。
和上一代Grace Blackwell相比,Vera Rubin在處理Agent任務時的吞吐量提升了10倍。
黃仁勛說,他們為Vera Rubin創造的供應鏈規模是Grace Blackwell的兩倍。
以前組裝一個Grace Blackwell機架需要兩小時,現在Vera Rubin只需要五分鐘。原因是設計改了。過去機架里有很多線纜和軟管,現在用PCB中板直接連接兩側,不再需要線纜、軟管和風扇。全部液冷,模塊化設計,熱插拔。
黃仁勛說,以前做Hopper時,最重要的工作是預訓練。到Grace Blackwell,重點是推理。
“很多人說推理很簡單,但推理就是錢。”
模型越來越復雜,要在高響應速度、快速交互和高吞吐下同時完成推理很困難。這就是NVLink 72的意義。
黃仁勛說,今天英偉達的token成本比競爭對手低一個數量級,因為他們做了協同設計,理解了推理的計算模式。
現在到了Agent時代,Agent不只是生成答案,它要觀察、推理、規劃、用工具,管理大量上下文,處理工作記憶和長期記憶,衍生出專家子Agent。Vera Rubin就是為這種工作才誕生的。
Vera Rubin平臺引入了英偉達 Spectrum-X以太網光子學,這是世界上第一個基于共封裝光學技術的交換機,有200Gb/s SerDes,如今已經投產。
共封裝光學是什么?
傳統網絡交換機用可插拔收發器,收發器插在交換機外面,需要額外的功率、散熱和空間。共封裝光學把光學模塊直接封裝在交換機芯片上,和臺積電合作做芯片級封裝。
這帶來三個好處。第一是能效提升5倍,因為光學模塊和芯片之間的距離縮短了,信號損耗更小。第二是AI正常運行時間延長5倍,因為減少了可插拔部件的故障點。第三是部署時間縮短三分之一,因為簡化了設計,為計算釋放了更多功率。
CoreWeave、Lambda和Oracle Cloud Infrastructure是首批采用共封裝光學網絡的合作伙伴。Lambda在博客中展示了英偉達首批共封裝光學樣品的開箱。黃仁勛說,通過簡化設計為計算釋放更多功率,英偉達共封裝光學網絡為百萬GPU AI工廠提供了基礎架構。
Vera Rubin平臺還集成了英偉達BlueField-4 DPU。
![]()
BlueField-4有高達800Gb/s速度的軟件定義網絡和內置多租戶隔離。借助英偉達 BlueField-4 Advanced Secure Trusted Resource Architecture,客戶可以簡化網絡操作,改善租戶隔離,在百萬GPU AI集群中獲得更大控制。
AI工廠越來越多地在Agent工作流中處理專有數據、受監管內容和關鍵任務模型。這需要針對共享或云環境中自主Agent定制的基礎設施安全性,因為基礎設施不能被隱式信任。
Vera Rubin平臺設計了全棧英偉達機密計算,用于機架規模的可信執行環境。Vera Rubin NVL72把Vera CPU、Rubin GPU、英偉達 NVLink網絡和安全功能結合到統一平臺中,在高速互連之間加密數據。這提供硬件級認證,確保系統防篡改。
在POD規模提供這種級別的保護還需要可編程軟件層,能在整個系統中執行、編排和調整安全策略。英偉達DOCA軟件平臺在每個Vera Rubin平臺機架和AI工廠層提供安全性,通過直接在BlueField-4硅中執行的能力保護數據、Agent、上下文內存和AI推理。
DOCA能做什么。它實現多租戶網絡隔離、零信任策略執行、運行時威脅檢測和高達800Gb/s速度的端到端加密,這些都不占用主機CPU資源,所以企業可以放心擴展AI工廠。
英偉達DSX平臺為Vera Rubin AI工廠提供完整的設計和運營基礎。DSX統一了參考設計、仿真、基礎設施軟件、設施和生態系統技術,幫助構建和運營針對最低token成本優化的節能AI工廠。
DSX是什么。黃仁勛說,全球在建設AI工廠,這是大規模基礎設施建設。AI工廠復雜度高,芯片、機架、網絡、電力、冷卻、電網,每一層都必須從端到端一起設計,因為計算就是收入。英偉達 DSX就是藍圖,是建設和運營AI工廠的參考設計,目標是高效率和高盈利能力。
DSX為Vera Rubin POD架構構建,對齊堆棧的每一層,從硅和系統到生命周期管理和多租戶操作,加快部署,提高規模運營可靠性和彈性。
Dell Technologies、HPE、Lenovo和Supermicro以及ASUS、Foxconn、GIGABYTE、Pegatron、Quanta Cloud Technology、Wistron和Wiwynn在采用英偉達 DSX來加速Vera Rubin的AI工廠建設。
DSX包含三個部分。第一是DSX Sim。Omniverse Blueprint合作伙伴可以在第一臺機架到場前就設計并驗證一座英偉達 Rubin AI工廠。他們可以規劃布局,模擬電力和冷卻,設計網絡,在數字孿生中驗證每次集成測試和每次變更。第二是DSX OS。工廠通電后,DSX OS接管運營,提供監控和修復基礎設施,把已安裝系統變成多租戶、彈性、AI就緒容量。第三是DSX Max-Q。
DSX Max-Q是什么。今天的AI工廠常常把電力過度配置40%,因為擔心峰值負載。DSX Max-Q可以讓運營商在相同電力預算下部署更多GPU。它有幾個技術。溫液冷卻可以在45攝氏度下運行,用更少的水和能源,把更多能源留給計算。動態電力分配可以把機架電力導向需要工作的地方,回收閑置瓦特。機架內部的電力平滑機制可以削平峰值電流和電涌。
貫穿整座工廠,AIAgent工作團隊會通過DSX Max-Q持續協調,平衡冷卻、電力和工作負載需求。DSX AI工廠還是彈性能量資產,可以和電網協同工作。DSX Flex能讀實時電網信號,在電網需要緩解壓力時動態調整工廠電力。
黃仁勛說,到本十年結束前會有100GW的AI工廠上線。由英偉達 DSX運營的AI工廠會以最高效率生產最低成本的token。
Vera Rubin什么時候可以買到。生產出貨從今年秋季開始。
黃仁勛說,過去英偉達是一家GPU公司。這些年來他們演進成系統公司。現在看到的是英偉達最復雜的系統。
最終客戶和合作伙伴不是想買一臺計算機,他們想建設AI工廠。
正因如此英偉達在再次轉型。技術現在延伸到基礎設施尺度。
合作伙伴包括發電、冷卻、電網供應商和工業基礎設施公司。他們在努力構建完整的堆棧,就像為GPU、Grace Blackwell、NVLink 72做的那樣。現在他們在構建完整的基礎設施系統,讓客戶可以建設AI基礎設施。
每個千兆瓦級AI工廠投入都從200億、300億美元開始,很快會達到每千兆瓦800億到1000億美元。1000億美元投入AI工廠,它必須第一次就能工作,而且必須立刻成功。
資本成本高,復雜度也高。就像設計芯片時會先在計算機里模擬芯片、再模擬整個系統一樣,現在也把AI工廠建在Omniverse里。可以在數字世界里建造這些系統,在現實世界動工前就完成驗證。
RTX是GPU,DGX是系統,現在DSX是基礎設施。
它包括系統和軟件,讓英偉達能和公司合作,把它們變成AI云。比如CoreWeave,最近它的價值已經達到數百億美元,在增長。
這些公司服務各自區域,也服務全球客戶。AI會無處不在,每家公司都會由AI驅動,每個地區都會建設自己的AI能力。它們需要完整的計算棧,硬件、軟件、庫,還有和第三方生態、第三方開發者連接的能力。
幫客戶建設和部署AI工廠很重要。原因是計算就是收入,現在計算就是利潤。沒有收入、沒有利潤就會變成虧損。黃仁勛說,這就是為什么英偉達是重要伙伴。他們創造完整基礎設施,把每件東西連接起來,進行了驗證,確保正常運轉。
time to first token更快,推理啟動更快,從推理轉向訓練也更快。每瓦產生的token比較多。因為把一切都整合起來,從頭設計、模擬整個系統,進行協同設計。可靠性也很重要。大型數據中心有數百萬條電纜和無數活動部件,要讓這些計算機和諧工作很困難。英偉達長期運行超大規模系統,這些經驗很重要。
最后是產品壽命。
幾年前Hopper時代的AI已經和今天完全不同。六年前Ampere時代還在談CNN,后來談Transformer,再后來談專家混合,現在談Agent系統。每隔幾個月軟件行業就會出現新技術。
如果架構不靈活,生態系統不豐富,資產壽命就不會長。因為全球軟件開發者都在用英偉達 CUDA,所以英偉達 CUDA生態的資產壽命會更長。也可以從成本的另一面理解,如果資產壽命長,總擁有成本就低。這就是差異。
黃仁勛說,買得越多,賺得越多。
全球的工廠和員工都在拼命工作,因為全世界都想賺錢。大家已經意識到,有用的AI到來了,可盈利的AI到來了,計算需求高得驚人,需求本身就是限制。
03
各種大模型
黃仁勛今天還發布了開源大模型Nemotron 3 Ultra。
Nemotron是 英偉達為世界構建的專用開源模型,專門為Agent工作負載設計。
和其他開源模型不同,Nemotron不只給你模型,還給你訓練模型所用的數據。
Nemotron針對長時間推理、長時間運行的工具任務、工具使用和任務解決進行訓練,是世界上最大的長時程推理模型之一。模型、訓練腳本和數據都對你開源。黃仁勛說,這是開源模型的最佳形態,讓你可以拿走它,繼續添加數據,讓它變得更好,并成為你自己的模型。
Nemotron 3 Ultra主要有三個優勢,第一是速度快近五倍。
它是世界上第一批基于混合架構的模型之一,結合了狀態空間模型SSM與專家混合MoE。這種架構速度極快。黃仁勛說,更快意味著你能用相同成本思考更久。
第二是降低約30%運行成本。
第三是完全開源,包括模型、訓練腳本和數據。
那么Nemotron 3 Ultra到底是干嘛用的呢?黃仁勛說了這么一個案例。
他說英偉達現在做芯片太復雜了,要靠工程師一行行查、一輪輪跑驗證,太慢也太貴。
因為每顆AI芯片里有海量的晶體管,每條線路、每個邏輯門都必須嚴絲合縫,只要一個小錯誤,就可能讓整顆芯片延期幾個月。
所以英偉達和Cadence做了一個“芯片設計AI助手團隊”。
這個團隊是一組會干活的Agent。
它能讀芯片設計規格,寫或修改RTL代碼,自動生成測試用例,調用Cadence的仿真工具Xcelium跑模擬,再用Jasper做形式化驗證。發現Bug后,它還能定位問題、改代碼、再跑一遍驗證。
這里面大概是這樣分工:
Codex像項目經理,負責調度整個流程。
Nemotron像技術大腦,負責推理、判斷、推進驗證循環。
Cadence工具棧像專業儀器,負責真正跑芯片仿真和驗證。
Open Shell像安全沙箱,確保Agent在受控環境里工作,不亂改、不亂跑。
一堆專家子Agent則分別負責寫RTL、建測試平臺、跑回歸測試、調試Bug。
以前芯片驗證要工程師手動反復做,周期可能是幾周;現在英偉達想讓AI Agent自動接管一部分流程,把“寫代碼、跑仿真、找Bug、修Bug、再驗證”變成自動循環,把芯片設計驗證從幾周壓到幾小時。
與此同時,黃仁勛搬出了英偉達最前沿的物理AI Cosmos 3。
![]()
黃仁勛說,語言模型領域有很多人在做,而在物理AI方面,我們絕對是全球最強之一。“我為我們的團隊感到驕傲。”
黃仁勛說:“對于語言模型,我們可以使用互聯網上的英語和各種語言文本訓練,因為這些內容來自人類寫作和閱讀。但要為機器人構建數據,數據必須來自感知,來自機器人的視角。而世界上大多數視頻數據都是第三人稱視角,不是第一人稱視角。因此,對Agent系統、機器人系統、物理AI來說,數據是最難解決的問題。”
英偉達想解決一個問題:機器人太缺訓練數據了。
訓練語言模型,可以用互聯網上的文字;但訓練機器人不一樣。機器人要學會走路、抓東西、開車、避障、在工廠里干活,它需要理解真實世界里的空間、動作、物體和物理規律。
可問題是,真實世界的數據很難收集。你不可能讓機器人在現實里無限試錯,因為太慢、太貴,也可能有危險。
所以黃仁勛的思路是,先讓人遠程操控機器人,給它做示范。
再用Omniverse做仿真,在虛擬世界里生成更多訓練場景。
再把普通視頻里的第三人稱視角,轉換成機器人自己的第一人稱視角。
最后,用Cosmos這種世界模型,讓AI自己理解和生成物理世界的數據。
Cosmos可以理解視頻里發生了什么,也可以根據文字、圖片、視頻生成符合物理規律的新視頻。比如你給它一個場景,它可以預測下一秒會發生什么;你讓它模擬機器人抓杯子,它可以生成這個動作過程;你讓它訓練自動駕駛,它可以制造各種道路情況。
所以黃仁勛才說“計算就是數據”,以前數據只能從現實世界采集,現在可以用計算生成。只要模型足夠強,計算機就能模擬真實世界,給機器人制造大量訓練材料。
這對物理AI很重要,因為機器人需要的不是會聊天的AI,而是懂現實世界怎么運轉的AI。
基于此,英偉達做了一個“人形機器人標準套件”,叫Isaac GR00T。
為什么要做這個?因為做人形機器人太難了。一個機器人身上有很多電機、傳感器、控制系統,還要有訓練數據、仿真環境、操作系統、AI模型和部署工具。以前每個研究團隊都要從零開始拼這些東西,光搭環境就可能花幾個月,真正研究還沒開始,人已經累半死。
所以英偉達說:我們直接給大家做一個參考平臺。
這個平臺不只是一個機器人硬件,而是一整套東西:
有機器人本體;有運行機器人的Jetson Thor計算平臺;有AI模型;有仿真工具Isaac Lab;有遠程操作工具Isaac Teleop;有Omniverse和Cosmos來生成合成數據;有訓練和評估環境;有Isaac ROS負責部署到真實機器人上。
你可以把它理解成機器人界的“開發樣機+操作系統+訓練工具包”。
研究者拿到GR00T之后,不用從零開始造機器人、搭仿真、接傳感器、寫底層系統,而是可以直接開始訓練機器人做任務。比如讓機器人學會抓東西、搬運、走路、在工廠里工作。你可以用英偉達的全套組件,也可以只用其中一部分,把自己的模型、傳感器或控制系統換進去。
黃仁勛說它有25個身體自由度,每只手31個自由度,身高大約6英尺,體重150磅,就是想說明它是一個接近真人尺寸、能做復雜動作的人形機器人參考設計。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.