![]()
摩爾線程不想只做中國英偉達。
文|Stargazer
編|劉俊宏
一家國產GPU公司的產品跨度能有多大?5月18日,摩爾線程的2026產品發布會現場,出現了一幅頗具反差的畫面。
舞臺一側展示的是夸娥萬卡智算集群,另一側是自研“長江”SoC驅動的智能終端MTT AICUBE和MTT AIBOOK。軟件端,摩爾線程給的是從數字世界智能體“小麥”,到加速物理AI落地的首個全棧具身智能仿真平臺MT Lambda,再到持續進化的MUSA生態。
從數據中心到客廳茶幾,摩爾線程在同一場發布會上展示了截然不同產品矩陣。
顯然,這不是一般芯片公司會做的事。它釋放的信號很明確:摩爾線程不只想做“國產英偉達”,而是要做一個覆蓋云邊端的全棧算力基礎設施提供商。“全功能GPU”加“統一架構”,是它押注的差異化路線。
從萬卡集群到家庭中樞一套架構打穿
摩爾線程的產品矩陣看似跨度極大,實則共用同一套MUSA架構內核。這是“全功能GPU”路線首次在中國市場完成云邊端的完整落地驗證。
先看云端,這一次摩爾線程給出的是一套大模型訓練的硬件基座。
基于MTT S5000構建的夸娥萬卡智算集群已經商業化落地,幾個硬指標值得關注:Dense大模型訓練算力利用率(MFU)達到60%,MoE大模型達40%,訓練線性擴展效率95%,有效訓練時長占比超過90%。這幾個數字合在一起的意思是——它不僅能跑起來,而且已經是能真實支撐行業應用的水平。
數據指標層面,MTT S5000單卡AI算力(稠密)為1000 TFLOPS,配備80GB顯存和1.6TB/s顯存帶寬,作為國內最早原生支持FP8精度的訓練GPU,在DeepSeek-V4、Qwen3.5、GLM-5.1等大模型上實現了“Day-0適配”。面向更大規模的智算需求,摩爾線程第五代“花港”架構已發布,支持十萬卡級擴展。更大的算力集群,才能應對不斷膨脹的大模型算力支出。
再看端側,本次發布會的最大新品亮點是MTT AICUBE。
![]()
摩爾線程對MTT AICUBE的定義很清晰:不是AI PC,不是NAS,而是“家庭AI中樞”。產品形態上,AICUBE整合了“小麥”全域智能體、50TOPS異構本地算力和全閃存私有云,標配1TB SSD,支持7×24小時運行。小麥智能體集成了90余項CLI系統工具、60余項技能和36款以上APP的跨應用控制,依托摩爾線程自研的MTClaw開源框架,高頻工具調用成功率超過95%。
摩爾線程AICUBE的戰略意圖,非常值得關注。
它搭載的“長江”SoC是摩爾線程自研芯片,集成8個2.65GHz全大核CPU、全功能GPU和高能效NPU,136GB/s內存帶寬,最高支持64GB LPDDR5X。這顆芯片同時支撐AI計算、圖形渲染和視頻編解碼——這正是“全功能GPU”理念在終端的延伸。摩爾線程把算力從智算中心推向家庭場景,本質上是在Token時代對端側算力需求的提前卡位。從某種角度來說,MTT AICUBE有點像是對標谷歌音響。兩者區別是谷歌能直連gemini,而MTT AICUBE對模型的支持更加開放。
最后是邊緣側AI產品,摩爾線程帶來了MTT E300 AI模組,它具有50TOPS異構算力、-20°C至+65°C寬溫設計,面向工業質檢、能源巡檢、具身智能、低空經濟等場景。從全球范圍來看,MTT E300 AI模組跟高通今年主推的躍龍系列有點像,都是主打工業領域的AI算力需求。
整體下來,E300與AIBOOK(AI算力本)、AICUBE共同構成“長江”SoC的落地三角,覆蓋個人、家庭到行業。
結合云端萬卡集群的配置,展示出摩爾線程“云邊端”三層不是割裂的產品線,而是MUSA統一架構在不同算力密度下的三種形態。
全功能GPU路線摩爾線程在布局什么?
摩爾線程的真正差異化,不在于產品線全,而在于它選擇了一條國內罕有的“全功能GPU”技術路線。這個選擇背后,是摩爾線程對AI算力終局的一種判斷。
什么是全功能GPU?簡言之,它不是只做AI加速,也不是圖形GPU(渲染),而是單一芯片同時支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的統一架構。換句話說,就是類似英偉達的GPU能力。其他大多數GPU廠商這邊,其產品還是有些專門設計,例如AMD的AI芯片和圖形芯片分屬兩套不同架構。
為什么摩爾線程要選擇這條路線?因為,未來的AI不只是大模型訓練,而是數字世界與物理世界的深度融合。
具身智能行業的發展,已經證明了這一點。在機器人的訓練環節中,需要“算+渲+仿”三合一——AI計算訓練大腦、圖形渲染構建仿真環境、物理引擎模擬真實交互。這在傳統架構中,各環節是分開不同設備執行的,這就意味著開發者不得不在異構平臺間反復切換。而摩爾線程基于MUSA統一架構,用同一顆芯片就能完成全部任務,數據不再需要“傳來傳去”。
看到了這一機會,摩爾線程為具身智能專門推出了MT Lambda——國內首個全棧具身智能仿真平臺,深度融合物理、渲染、AI三大引擎。今年3月,摩爾線程開源了MuJoCo Warp MUSA,為物理仿真平臺MuJoCo提供了國產算力支持,在機器狗訓練任務中相較CPU方案實現最高40倍加速。與智源研究院合作,基于千卡S5000集群完成了RoboBrain 2.5具身大腦模型的端到端訓練,實測與國際主流GPU結果高度一致。與小馬智行、光輪智能、五一視界的合作也在密集落地。
![]()
摩爾線程在這個賽道的卡位,本質上是在賭一個判斷:物理AI時代,只有全功能GPU能同時支撐“思考”與“行動”兩種計算范式。
最后,依然是老生常談的國產GPU突破最重要的生態難題。在這一部分,摩爾線程也介紹了不少新的進展。
目前,MUSA SDK 5.1.0兼容CUDA 12.8,核心API兼容數達761,PyTorch全量3194個算子100%兼容。軟件工具層面,摩爾線程獲得了SGLang、vLLM、TileLang三大全球頂級推理框架的官方原生支持。這意味著國產GPU開始從“兼容可用”走向“被主流生態主動接納”。在開發者社區層面,目前摩爾線程也擁有45萬+的社區開發者和200+高校覆蓋,這些也能為長期生態建設提供了基礎。
![]()
但必須指出的是,生態建設沒有捷徑。從兼容CUDA到建立真正自主的MUSA原生生態,從跟隨到引領,這才是真正的長征。
結語
國產GPU的競爭正在從“有沒有”,進入“能不能打”的第二階段。
根據IDC數據顯示,2025年中國AI加速卡總出貨量約400萬張,其中國產廠商交付約165萬張,國產份額達41%。這組數據已經證明,中國GPU不僅能用,而且已經開始承擔AI算力市場的重要角色。
在這一變局中,摩爾線程作為對標英偉達的玩家,正在用統一架構打通云邊端,用全功能GPU卡位物理AI時代。至于統一架構能否支撐摩爾線程從“國產替代”真正走向“國際競爭”?接下來AICUBE的京東預售數據和夸娥集群的訂單增速,會在今年給出初步答案。
或許,摩爾線程的未來仍然是辛苦的。
根據公司財報顯示,摩爾線程2025年營收15.06億元、同比增長243%,2026年一季度營收7.38億元、同比增長155%——高增速背后,是摩爾線程從“賣芯片”向“賣算力基礎設施”的轉型加速。
但無論如何,摩爾線程已經證明了一件事:國產GPU不僅可以追隨,也可以嘗試定義一條屬于自己的技術路線。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.