英偉達與亞馬遜正聯(lián)手推進新一代存儲架構(gòu)研發(fā),通過創(chuàng)新技術實現(xiàn) GPU 直接控制 SSD 等存儲設備,跳過傳統(tǒng) CPU 調(diào)度環(huán)節(jié),有望破解當前 AI 算力發(fā)展的核心瓶頸。英偉達計劃在下一代 Vera Rubin AI 平臺,率先導入 “GPU 發(fā)起直接存儲訪問”(GIDS)技術,開啟算力架構(gòu)全新變革。
![]()
AI生成
當前計算機沿用的馮?諾依曼架構(gòu),存在明顯的數(shù)據(jù)傳輸短板。所有數(shù)據(jù)都需經(jīng)過 CPU 中轉(zhuǎn)、DRAM 緩存后,才能輸送至 GPU,CPU 有限的線程處理能力,難以匹配 GPU 數(shù)萬級并行算力,數(shù)據(jù)搬運效率低下,成為制約 AI 模型訓練與推理速度提升的關鍵難題。
GIDS 技術的核心突破,便是打通 GPU 與存儲設備的直接通路。該技術可讓 GPU 直接向 SSD、高速閃存下發(fā)訪問指令,全程繞開 CPU 與 DRAM,省去多層調(diào)度流程,大幅降低數(shù)據(jù)傳輸延遲,釋放 GPU 算力潛力。
為適配這一全新架構(gòu),高帶寬閃存(HBF)應運而生,有效彌補傳統(tǒng) HBM 容量不足的短板。延世大學宋基煥教授團隊測試數(shù)據(jù)顯示,6 顆 HBF 搭配 2 顆 HBM,可將 GPU 存儲容量從 192GB 提升至 3120GB,擴容幅度超 16 倍。技術應用上,HBF 更適配 AI 推理場景下固定模型參數(shù)存儲,高頻訓練場景依舊依賴 HBM 發(fā)揮性能優(yōu)勢。
目前該技術賽道已迎來多方巨頭布局。英偉達主導 GIDS 技術標準制定,亞馬遜優(yōu)先在云端算力集群落地應用;微軟、AMD 同步推進自研方案,三星發(fā)力 Z?NAND 閃存搶占硬件市場。
業(yè)內(nèi)人士表示,GPU 直連存儲技術的落地,將重構(gòu) AI 算力底層架構(gòu),不僅能提升云端大模型運行效率,也將推動 AI 產(chǎn)業(yè)向更高性能、更低延遲方向迭代,成為未來算力競爭的重要突破口。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.