文/觀察者網(wǎng) 呂棟
6月23日下午,在德國漢堡國際超算大會(ISC2026)上,新一期全球超算TOP500榜單公布。其中全國產(chǎn)自主研制的“靈晟”超級計算機,以2.19EFlops(每秒10的18次方浮點運算)持續(xù)雙精度浮點性能登頂。
這不僅是世界首臺持續(xù)性能超二百億億次(2EFlops)的超算系統(tǒng),也是繼2017年“神威·太湖之光”之后,中國超算時隔九年再次重返世界第一。同時,“靈晟”也是全球第五臺百億億次級超級計算機。
在本次排名中,美國勞倫斯·利弗莫爾國家實驗室的El Capitan以1.809 Exaflop/s位列第二,美國橡樹嶺國家實驗室的Frontier以1.353 Exaflop/s位列第三。
國家超級計算深圳中心發(fā)文直言,“靈晟”全面領(lǐng)先美歐E級超算,強勢宣告中國超算重回世界之巔。
“靈晟”最值得關(guān)注的,在于走了一條與當(dāng)前主流超算不同的路。頒獎儀式上,“靈晟”超算系統(tǒng)總設(shè)計師、國家超算深圳中心主任、中山大學(xué)教授盧宇彤指出,超算發(fā)展已邁入超智融合新階段,“靈晟”系統(tǒng)首創(chuàng)Online Acceleration的全CPU架構(gòu),打破傳統(tǒng)CPU-GPU異構(gòu)架構(gòu)壁壘,內(nèi)嵌AI矩陣加速單元,回歸計算加速的本質(zhì),實現(xiàn)超算智算等多種計算模式的高效協(xié)同,全面賦能科學(xué)智能計算。
從架構(gòu)來看,“靈晟”共包含20480個計算節(jié)點,每個節(jié)點搭載兩顆基于ARMv9架構(gòu)的LX2處理器,運行頻率1.55GHz。每顆處理器包含兩個計算芯粒,每個芯粒劃分為四個NUMA域,每個NUMA域包含38個ARMv9核心和4GB高帶寬內(nèi)存。全系統(tǒng)共計近1400萬個CPU核心。節(jié)點之間采用國產(chǎn)“靈啟”互連技術(shù),以雙平面多軌胖樹拓?fù)溥B接,每節(jié)點帶寬1.6Tb/s;系統(tǒng)運行麒麟操作系統(tǒng)。
![]()
盧宇彤分享到,“靈晟”定位為面向科學(xué)工程智能計算的國產(chǎn)全棧融合基礎(chǔ)設(shè)施:
在芯片層,自研LX2CPU創(chuàng)新性引入多精度與矩陣加速等能力,實現(xiàn)片上超算算力與智能算力深度融合,并集成了首顆國產(chǎn)HBM,內(nèi)存帶寬相比傳統(tǒng)CPU提升10倍;在網(wǎng)絡(luò)層,自主設(shè)計的靈啟高速互連網(wǎng)絡(luò)可支持200萬個端口、10萬節(jié)點的超大規(guī)模組網(wǎng);在存儲層,采用分層架構(gòu),兼顧高性能作業(yè)區(qū)與容量型數(shù)據(jù)區(qū),可擴展至E級;在系統(tǒng)層,構(gòu)建大規(guī)模超智融合框架,自研全棧軟件,將底層硬件能力以可用、可編程、可優(yōu)化的方式釋放給應(yīng)用,提高各領(lǐng)域應(yīng)用性能;在節(jié)能方面,首創(chuàng)100%全液冷散熱計算機柜,以51GFlops/W能效比,在世界第一的持續(xù)性能之上,樹立綠色計算新標(biāo)桿。
![]()
全球超算算力排名
超算是擁有極高計算速度和強大并行處理能力的計算系統(tǒng),專門用于處理科學(xué)研究、氣候模擬、藥物研發(fā)、天體物理等需要大量計算的數(shù)據(jù)密集型任務(wù),可預(yù)測天氣、模擬臺風(fēng)路徑、研發(fā)新藥、篩選抗癌分子。
上一次中國超算登頂TOP500,是2017年的“神威·太湖之光”。這臺安裝于國家超級計算無錫中心的集群,以93 Petaflop/s的Linpack成績位居榜首,并保持了兩年半之久,直到2018年春季橡樹嶺國家實驗室的IBM Summit系統(tǒng)問世。“神威·太湖之光”采用中國自主設(shè)計的“申威”系列芯片,是全球第一臺運行速度超過10億億次/秒的超級計算機,峰值性能高達12.5億億次/秒,持續(xù)性能達到9.3億億次/秒。2019年,美國政府對華實施制裁并限制中國獲取最強大的芯片,此后中國停止了向TOP500提交Linpack測試結(jié)果。盡管中國仍在繼續(xù)建設(shè)超算,但在此后近九年的時間里,TOP500榜首一直由美國和歐洲的系統(tǒng)占據(jù)。
如今“靈晟”的登頂,打破了這一局面。
![]()
“靈晟”超算系統(tǒng)總設(shè)計師、國家超算深圳中心主任、中山大學(xué)教授盧宇彤
本次TOP500榜單中,“靈晟”登頂后,其他超算排名均順延一位。勞倫斯·利弗莫爾國家實驗室的El Capitan以1.809 Exaflop/s位列第二,橡樹嶺國家實驗室的Frontier以1.353 Exaflop/s位列第三,阿貢國家實驗室的Aurora以1.012 Exaflop/s位列第四,德國于利希超級計算中心的JUPITER Booster以1.000 Exaflop/s位列第五。前十名中有一張新面孔——意大利能源公司埃尼集團的HPC7以571.5 Petaflop/s首次亮相便躋身第六。微軟Azure云平臺的Eagle系統(tǒng)降至第七,意大利埃尼的HPC6位列第八,日本的Fugaku以442 Petaflop/s位列第九,瑞士的Alps以434.9 Petaflop/s位列第十。
TOP500在新聞稿中指出,超級計算領(lǐng)域的高端架構(gòu)正呈現(xiàn)出顯著的多樣性。從全中國自主研發(fā)的全CPU架構(gòu)的“靈晟”,到配備AMD加速器的HPE Cray集群(如El Capitan和Frontier),再到采用英偉達 Grace Hopper架構(gòu)的JUPITER Booster和Alps,乃至搭載英特爾Ponte Vecchio GPU的Aurora系統(tǒng),沒有哪一種架構(gòu)占據(jù)絕對主導(dǎo)地位。微軟的Eagle集群結(jié)合了Intel Xeon處理器和Nvidia H100加速器,而日本的Fugaku則基于富士通的A64FX Arm處理器構(gòu)建。“這份榜單表明,通往領(lǐng)先級計算領(lǐng)域并沒有單一的主導(dǎo)技術(shù)路徑。相反,廠商們正在探索各種CPU、GPU、APU和定制加速器方案,并結(jié)合不同的互連和系統(tǒng)設(shè)計。”
“靈晟”的登頂,不僅是性能的突破,更是一種技術(shù)路線的驗證。在AMD與英偉達GPU對華出口禁令持續(xù)生效的背景下,中國超算選擇了一條不依賴外部GPU的全CPU路徑,并在全球最權(quán)威的性能榜單上證明了這條路徑的可行性。這背后是芯片、互連、存儲、系統(tǒng)軟件、散熱等各個環(huán)節(jié)的全面自主突破。“靈晟”的價值最終體現(xiàn)在應(yīng)用上——在大規(guī)模并行環(huán)境下平均擴展效率84.4%,實現(xiàn)了超過千萬核心的全系統(tǒng)高效可擴展運行。從2017年“神威·太湖之光”的93 Petaflop/s到2026年“靈晟”的2.198 Exaflop/s,中國超算在近九年的時間里完成了超過23倍的性能躍升,重新定義了全球超算的算力天花板。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.