![]()
英偉達公司在臺北Computex大會上宣布,正在加速生產即將推出的Vera Rubin平臺,該平臺將成為新一代人工智能工廠的基礎,并在未來數年主導企業基礎設施領域。
英偉達今年3月在年度GTC開發者大會上首次發布了Vera Rubin,此次宣布系統進入批量生產階段,意味著該平臺離正式面世更近一步。
Vera Rubin以首位發現暗物質證據的天文學家命名,它不僅僅是英偉達上一代圖形處理器的簡單升級。該公司表示,這是一次完整的架構革新,旨在推動企業向"智能體AI"轉型——在這個世界中,自主AI智能體能夠進行推理、使用第三方軟件工具并代表人類執行復雜工作負載。
全新架構設計
Vera Rubin平臺以英偉達新一代Rubin圖形處理器為核心,這是Grace Blackwell GPU的繼任者,但平臺遠不止于此。它還包括英偉達新推出的Vera中央處理器、NVLink 6交換機、ConnectX-9 SuperNIC、BlueField-4數據處理單元和Spectrum-6以太網交換機,以及專為支持萬億參數模型推理的確定性、低延遲需求而設計的Nvidia Groq 3語言處理單元。這些組件整合成一個完全集成的系統,在規模化部署時可提供比上一代Grace Blackwell平臺高10倍的"智能體AI"吞吐量。
英偉達創始人兼首席執行官黃仁勛在Computex主題演講中解釋說,智能體AI是一種全新的工作負載類型,因此需要全新的基礎架構。"一個提示詞可以啟動包含推理、檢索、工具使用和響應生成的千步旅程,"他說。"Vera Rubin正是為這一時刻而生——一個能夠大規模提供智能的AI工廠引擎,具備推動下一次工業革命所需的性能、效率和安全性。"
大規模量產啟動
Vera Rubin是英偉達MGX機架級系統的第三代產品,將以前所未有的規模進行大規模生產,涉及分布在30個國家的350多家供應鏈合作伙伴。其主要合作伙伴包括戴爾科技、慧與科技、超微電腦和聯想集團,這些公司都在制造Vera Rubin服務器,并將于今年晚些時候交付給英偉達的云和企業客戶。
全新的Vera Rubin NVL72機架級系統是Vera Rubin平臺的核心。這是一個液冷機架級系統,由72個Rubin GPU和36個Vera CPU組成,通過高速NVLink 6互連實現"突破性效率"。
例如,英偉達表示,Vera Rubin NVL72平臺可用于訓練大型專家混合模型,所需GPU數量僅為上一代Blackwell芯片的四分之一。在推理方面,該公司表示Vera Rubin將提供10倍的吞吐量,而每個Token的成本僅為十分之一。
為支持其設想的大規模AI工廠部署,英偉達推出了全球首款基于共封裝光學技術的網絡交換機——Nvidia Spectrum-X以太網光子學。這是新一代交換技術,據稱可提供比傳統收發器網絡高5倍的能效、5倍的AI正常運行時間和1.3倍的部署速度。
該平臺還集成了英偉達新推出的BlueField 4數據處理單元,其軟件定義網絡速度高達每秒800GB,并內置多租戶隔離功能,可簡化網絡操作并提高底層Vera Rubin GPU的效率。英偉達表示,BlueField-4 STX存儲機架旨在充當專用的"上下文內存"層,AI智能體可以使用它在大規模多輪交互中保持連貫性。通過將緩存數據卸載到BlueField-4芯片,企業可以將推理吞吐量提高多達5倍。
機架級安全保障
BlueField-4 STX在幫助保護英偉達AI工廠方面也發揮著至關重要的作用,這些工廠越來越多地處理敏感且受到高度監管的數據,這些數據不能暴露給第三方AI系統。此類工作負載需要增強的安全措施,這就是為什么Vera Rubin被設計為在機架級實現全棧機密計算,數據在GPU和CPU之間通過高速互連傳輸時進行加密。
基礎安全由一個新的可編程軟件層提供,該軟件層旨在在整個系統中執行、編排和調整安全策略。這由BlueField-4 STX中的新Nvidia DOCA安全創新提供支持,在硅層執行安全策略。據稱,DOCA能夠實現多租戶網絡隔離、零信任策略執行、運行時威脅檢測以及高達每秒800GB的加密速度。
"智能體AI將企業數據轉變為一個實時運行的系統——而這個系統必須在數據移動、上下文存儲和智能體行動的地方受到保護,"黃仁勛說。"通過Vera BlueField-4 STX,英偉達及其生態系統正在構建安全設計的存儲基礎設施,以AI的速度在硅層執行信任。"
智能體工作負載專用處理器
Vera Rubin平臺的另一個關鍵元素是Vera CPU,這是一類專門為大規模運行智能體工作負載而設計的新型處理器,與標準x86芯片相比具有更高的速度和能效。
Vera CPU是英偉達Grace CPU的繼任者,早期基準測試表明,它可以在關鍵智能體工作負載(包括代碼編譯和數據庫處理)中提供出色的性能。這些類型的工作負載將成為大多數AI工廠的核心業務,為更高的吞吐量和更高效的單個AI智能體鋪平道路。
"AI智能體將成為計算資源的最大用戶,"黃仁勛解釋說。"Vera是為這一未來設計的首款CPU——專為以超大規模運行智能體AI而構建,具有非凡的性能、效率和可編程性。"
英偉達認為,Vera CPU還將幫助加速AI工廠經濟學從每美元核心數向每美元Token數的轉變。它基于一個名為Olympus的新型定制CPU核心,專為Python運行時和沙盒代碼執行到編排邏輯和分析管道等任務而設計。
英偉達表示,Olympus使Vera能夠處理更多指令、預測應用程序行為并實時在大量并發環境中移動數據。每個CPU配備88個Olympus核心、空間多線程和支持每秒1.2TB帶寬的LPDDR5X內存子系統,確保智能體在CPU密集型步驟上的等待時間大大減少,從而提高AI工廠的整體效率。
此外,Vera CPU與BlueField-4 STX處理器緊密集成,以受益于其嵌入式硅安全功能。
Vera Rubin平臺的最后一個組件是Nvidia DSX,這是一個架構藍圖,為現代AI工廠提供完整的設計和運營基礎。它統一了參考設計、模擬、基礎設施軟件和生態系統技術,幫助服務器制造商開發針對性能和更低Token成本優化的節能AI系統。
通過采用DSX,英偉達的合作伙伴(包括戴爾、慧與、聯想和超微等)都在加速生產首批Vera Rubin系統,英偉達預計首批完整系統將在秋季交付給客戶。
Q&A
Q1:Vera Rubin平臺是什么?它有什么特別之處?
A:Vera Rubin是英偉達推出的新一代AI工廠基礎平臺,以發現暗物質證據的天文學家命名。它不是簡單的GPU升級,而是完整的架構革新,專為智能體AI設計。該平臺整合了Rubin GPU、Vera CPU、NVLink 6交換機等多個組件,可提供比上一代高10倍的智能體AI吞吐量,推理成本僅為十分之一。
Q2:Vera Rubin平臺什么時候能投入使用?
A:英偉達已宣布Vera Rubin進入批量生產階段,涉及30個國家的350多家供應鏈合作伙伴。戴爾、慧與、聯想和超微等主要合作伙伴正在制造Vera Rubin服務器,預計首批完整系統將在今年秋季交付給云和企業客戶。
Q3:Vera CPU相比傳統處理器有什么優勢?
A:Vera CPU是專門為大規模運行智能體工作負載設計的新型處理器,相比標準x86芯片具有更高速度和能效。它基于Olympus定制核心,每個CPU配備88個核心,支持每秒1.2TB的內存帶寬,在代碼編譯和數據庫處理等智能體核心工作負載中表現出色,能大幅減少AI智能體的等待時間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.