6月1日上午11點(diǎn),英偉達(dá)(NVIDIA)創(chuàng)始人兼CEO黃仁勛在中國(guó)臺(tái)北流行音樂中心發(fā)表“GTC Taipei at COMPUTEX”主題演講,為COMPUTEX 2026提前揭開序幕。
![]()
在這場(chǎng)被視為年度全球AI產(chǎn)業(yè)風(fēng)向標(biāo)的演講中,黃仁勛宣布Vera Rubin AI計(jì)算平臺(tái)已全面投入量產(chǎn),并首次發(fā)布專為AI PC打造的RTX Spark芯片。他強(qiáng)調(diào),英偉達(dá)已由GPU公司轉(zhuǎn)型為AI基礎(chǔ)設(shè)施公司,目標(biāo)是成為2030年前全球新增超100GW AI工廠容量的核心供應(yīng)者。
Vera Rubin已投入量產(chǎn)
黃仁勛在開場(chǎng)演講中指出,AI工廠(AI Factory)已成為未來十年全球最大規(guī)模的基礎(chǔ)建設(shè)。目前1GW等級(jí)AI工廠投資金額已從200億至300億美元,增加至500億至600億美元。未來更可能達(dá)到800億至1000億美元。
他表示,AI工廠的價(jià)值已不只是數(shù)據(jù)中心,而是直接創(chuàng)造Token與收益的生產(chǎn)設(shè)施,“算力就是營(yíng)收”。未來競(jìng)爭(zhēng)關(guān)鍵不再是單一芯片性能,而是整體AI工廠效率。 包括:Throughput per Watt(每瓦吞吐量)、Tokens per Watt(每瓦Token產(chǎn)出)、Time to First Token(首次產(chǎn)出Token時(shí)間)、系統(tǒng)可靠度與利用率都將直接影響AI工廠獲利能力。
黃仁勛預(yù)估,到2030年前,全球?qū)⑿略龀^100GW AI工廠容量。 而英偉達(dá)的目標(biāo),正是成為這場(chǎng)AI基礎(chǔ)建設(shè)革命的核心供應(yīng)者。
為應(yīng)對(duì)這樣的需求,英偉達(dá)已從GPU公司進(jìn)一步轉(zhuǎn)型為AI Infrastructure Company(AI基礎(chǔ)設(shè)施公司),因?yàn)榭蛻舨幌朐儋I電腦,而是想打造AI工廠,同樣英偉達(dá)Vera Rubin不只是GPU,而是一套專為Agentic AI設(shè)計(jì)的異質(zhì)運(yùn)算系統(tǒng)。
黃仁勛在發(fā)布會(huì)上宣布,英偉達(dá)最新的Vera Rubin平臺(tái)已投入量產(chǎn)(in full production)。這需要感謝供應(yīng)鏈合作伙伴的支持。
![]()
Vera Rubin平臺(tái)由Vera CPU、Rubin GPU、NVLink 6交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU及Spectrum-6以太網(wǎng)交換機(jī)等全新芯片,經(jīng)過數(shù)百道制程步驟才最終成型,包括臺(tái)積電的3nm制程、CoWoS-R和CoWoS-L封裝。此外,還有來自美光(Micron)、SK海力士(hynix)和三星(Samsung)的HBM4內(nèi)存,Vera Rubin計(jì)算板,一塊電路板整合了6萬億個(gè)晶體管和超過1.8萬個(gè)組件,最終成為一臺(tái)性能驚人的AI超級(jí)計(jì)算機(jī),可以大幅縮短AI訓(xùn)練時(shí)間并降低推理Token生成成本。
黃仁勛指出,Vera Rubin基于一款新型模塊化運(yùn)算托盤,采用全新PCB中板設(shè)計(jì)結(jié)構(gòu)更加精簡(jiǎn),Superchips、ConnectX-9 SuperNIC和BlueField-4 DPU均可直接對(duì)接,無需電纜,從而在AI工廠規(guī)模上實(shí)現(xiàn)極高的韌性。
針對(duì)Vera Rubin NVL72服務(wù)器,黃仁勛表示,18個(gè)計(jì)算托盤、9個(gè)可熱插拔的NVLink交換器托架,全新的高效分流管,液冷母線承載超過5000安培的電流,相當(dāng)于20輛電動(dòng)車全速加速時(shí)的電流。第3代MGX機(jī)架設(shè)計(jì)由130萬個(gè)組件組成,微軟的Vera Rubin NVL72工程機(jī)架已經(jīng)投入使用,戴爾和Coreweave也成功搭建了其Vera Rubin NVL72工程機(jī)架。
黃仁勛還重點(diǎn)介紹了可直接對(duì)外單獨(dú)供應(yīng)的Vera CPU。該CPU擁有88顆英偉達(dá)基于Arm架構(gòu)定制的Olympus 核心,具備1.2 TB/s 內(nèi)存帶寬。
![]()
官方宣稱,Vera CPU 每核心性能是上一代的1.5倍,每瓦性能則是上一代的2倍,機(jī)架密度更是達(dá)到了上一代的4倍,目標(biāo)是在高負(fù)載、平行且即時(shí)的工作中,提升整體AI 工廠效率與回應(yīng)速度。與x86 CPU相比,Vera CPU在智能體方面性能平均提升了80%。
![]()
在不久前的財(cái)報(bào)會(huì)議上,英偉達(dá)還表示其目標(biāo)是成為“全球領(lǐng)先的CPU供應(yīng)商”,這也為英偉達(dá)開辟了一個(gè)新的2000億美元總可定位市場(chǎng),今年有望實(shí)現(xiàn)近200億美元的CPU總收入。需要指出的是,這200億美元指的是獨(dú)立CPU收入,而非捆綁在Vera Rubin旗下的CPU。
黃仁勛指出,Vera CPU機(jī)架,將256個(gè)中央處理器(CPU)封裝在單一液冷機(jī)架中,負(fù)責(zé)協(xié)調(diào)模型、重新分配內(nèi)存、啟動(dòng)工具。
此外,在富士康和廣達(dá),英偉達(dá)的Groq 3 LPX正在成型,256個(gè)Groq 3 LPU分裝于16個(gè)托盤上,每秒40PB的SRAM帶寬,實(shí)現(xiàn)超低延遲。
Vera BlueField-4 STX則是AI儲(chǔ)存記憶的地方,BlueField-4加速儲(chǔ)存處理,將存儲(chǔ)器、儲(chǔ)存空間與芯片內(nèi)建安全機(jī)制完美連結(jié)。
Spectrum-X以太網(wǎng)絡(luò)光子學(xué),采用200Gbps共同封裝光學(xué)元件的以太網(wǎng)絡(luò)交換器,臺(tái)積電的COUPE制程、芯片級(jí)封裝,以及在磷化銦上的超高功率激光裸晶技術(shù)。
黃仁勛表示,Vera Rubin是英偉達(dá)史上最雄心勃勃的計(jì)劃,來自英偉達(dá)及供應(yīng)鏈合作伙伴超過4萬名工程師共同參與開發(fā)。這其中特別離不開與臺(tái)灣供應(yīng)鏈的極致協(xié)同設(shè)計(jì),目前英偉達(dá)已經(jīng)在臺(tái)灣擁有150家供應(yīng)鏈合作伙伴、數(shù)百萬平方英尺的廠房面積、數(shù)百個(gè)廠址,將芯片、封裝、系統(tǒng)和數(shù)據(jù)中心,在尺寸、功率與規(guī)模方面都推向極限。“臺(tái)灣從一開始就和我們?cè)谝黄稹保爸x謝你臺(tái)灣”,黃仁勛說道。
推出NVIDIA DSX平臺(tái)
英偉達(dá)除了開發(fā)AI系統(tǒng)之外,也開始幫助客戶部署及興建AI工廠,推出了全新的DSX(Digital Systems Infrastructure)平臺(tái),該平臺(tái)為基礎(chǔ)設(shè)施建設(shè)者提供了創(chuàng)建人工智能工廠的完整方案。
英偉達(dá)DSX將開源、模塊化的軟件庫(kù)、應(yīng)用程序編程接口、參考設(shè)計(jì)、NVIDIA 加速計(jì)算平臺(tái)以及合作伙伴技術(shù)整合到一個(gè)通用的、共同設(shè)計(jì)的平臺(tái)上,用于AI工廠的設(shè)計(jì)、部署和運(yùn)營(yíng)。
![]()
黃仁勛表示,“DSX是一套基礎(chǔ)設(shè)施”,這套系統(tǒng)采用把溫度控制在攝氏45度上下的液冷技術(shù)、動(dòng)態(tài)電力分配系統(tǒng)、機(jī)柜內(nèi)平順功率技術(shù),還能讀取即時(shí)電網(wǎng)信號(hào),緩解供電壓力。他還展示了“DS X AI工廠”生態(tài)系統(tǒng),涵蓋許多臺(tái)灣供應(yīng)鏈廠商。
![]()
黃仁勛還表示,AI模型正加速演進(jìn),因此架構(gòu)必須保持靈活,而英偉達(dá)的AI系統(tǒng)擁有高可靠性和靈活性,并且全球軟件開發(fā)者都以英偉達(dá)CUDA平臺(tái)打造工具,這也將拉長(zhǎng)軟件的壽命。他說,換句話來說就,“買的(英偉達(dá)AI系統(tǒng))越多,賺的越多”。
推出首款PC芯片RTX Spark
作為此次主題演講的重頭戲,黃仁勛正式發(fā)布了全球首款專為個(gè)人代理打造的Windows個(gè)人電腦(PC)芯片RTX Spark(之前外界稱之為N1X),號(hào)稱是“史上效率最高的PC平臺(tái)”。
![]()
RTX Spark實(shí)際上就是英偉達(dá)此前推出的個(gè)人AI 超級(jí)電腦“Project DIGITS”(DGX Spark )所搭載的GB10 Grace Blackwell超級(jí)芯片變體,由英偉達(dá)與聯(lián)發(fā)科合作設(shè)計(jì)的,基于臺(tái)積電3nm制程打造。
具體來說,RTX Spark核心規(guī)格與 DGX Spark 上的 GB10 Grace Blackwell 超級(jí)芯片一致,CPU 擁有 10 個(gè) Cortex-X925 內(nèi)核與 10 個(gè) Cortex-A725 內(nèi)核,集成了Blackwell架構(gòu)的GPU(配備6,144個(gè)CUDA核心),支持最高 128GB 的 256-bit LPDDR5X 內(nèi)存,最高300GB/s內(nèi)存帶寬,提供 12 條 PCIe Gen5 通道和 5 條 PCIe Gen4 通道。需要指出的是,RTX Spark的CPU與GPU之間通過NVLink C2C(Chip-to-Chip)高速互連技術(shù)連接。
![]()
憑借RTX Spark高達(dá)1 PetaFLOP FP4 AI算力,再加上128GB內(nèi)存,能為AI代理與1,200億參數(shù)(120B Parameters)的大型模型提供充足運(yùn)算資源,并支援長(zhǎng)達(dá)100萬Token的上下文對(duì)話,適合執(zhí)行長(zhǎng)時(shí)間且復(fù)雜的推理工作。
![]()
英偉達(dá)公布了RTX Spark后續(xù)多代產(chǎn)品的路線圖,差不多是2年升級(jí)一代。現(xiàn)在的RTX Spark是Grace CPU+Blackwell GPU,2027年至2028年間會(huì)升級(jí)到Vera CPU+Rubin GPU,內(nèi)存也會(huì)升級(jí)到LPDDR6標(biāo)準(zhǔn),網(wǎng)絡(luò)芯片升級(jí)到CX9,1600G帶寬;2029年至2030年間,CPU將升級(jí)至Rosa架構(gòu),網(wǎng)絡(luò)芯片升級(jí)CX10,GPU則升級(jí)至Feynman架構(gòu)。
黃仁勛表示,英偉達(dá)與PC產(chǎn)業(yè)的關(guān)系,始于微軟Windows操作系統(tǒng),經(jīng)歷了40年的個(gè)人計(jì)算時(shí)代。從Windows 95操作系統(tǒng)讓計(jì)算機(jī)普及成為“個(gè)人PC”,以正確的架構(gòu),開啟了PC時(shí)代,成為人人生活不可或缺的工具。現(xiàn)在,英偉達(dá)與微軟正“重新發(fā)明”PC,在PC端執(zhí)行AI代理,打造出個(gè)人化AI。
![]()
黃仁勛進(jìn)一步指出,這是PC產(chǎn)業(yè)40年來首次迎來完整重新設(shè)計(jì)。他強(qiáng)調(diào),RTX Spark集合了英偉達(dá)三十年來的技術(shù)之大成,包括CUDA、RTX、DLSS、FP4、OptiX、G-Sync等,能完整執(zhí)行英偉達(dá)全部軟件堆棧,讓過去需要數(shù)據(jù)中心處理的AI工作,現(xiàn)在可直接在終端設(shè)備上完成。
據(jù)介紹,包括戴爾、惠普、聯(lián)想、微軟、華碩(ASUS)和微星(MSI)等合作伙伴都將推出基于RTX Spark平臺(tái)的高端筆記本電腦產(chǎn)品。
![]()
從定價(jià)來看,市場(chǎng)預(yù)計(jì)RTX Spark筆記本的設(shè)備售價(jià)不低。參考此前DGX Spark約4699美元的定價(jià),RTX Spark筆記本可能起售價(jià)在3萬至4萬元人民幣區(qū)間,短期內(nèi)更偏向高端用戶和開發(fā)者市場(chǎng)。
編輯:芯智訊-浪客劍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.