網易首頁 > 網易號 > 正文申請入駐

摩爾線程“云邊端“全棧發布：國產GPU一個更大的故事

2026-05-22 13:12:07　來源: 光錐智能

北京舉報

分享至

摩爾線程不想只做中國英偉達。

文｜Stargazer

編｜劉俊宏

一家國產GPU公司的產品跨度能有多大？5月18日，摩爾線程的2026產品發布會現場，出現了一幅頗具反差的畫面。

舞臺一側展示的是夸娥萬卡智算集群，另一側是自研“長江”SoC驅動的智能終端MTT AICUBE和MTT AIBOOK。軟件端，摩爾線程給的是從數字世界智能體“小麥”，到加速物理AI落地的首個全棧具身智能仿真平臺MT Lambda，再到持續進化的MUSA生態。

從數據中心到客廳茶幾，摩爾線程在同一場發布會上展示了截然不同產品矩陣。

顯然，這不是一般芯片公司會做的事。它釋放的信號很明確：摩爾線程不只想做“國產英偉達”，而是要做一個覆蓋云邊端的全棧算力基礎設施提供商。“全功能GPU”加“統一架構”，是它押注的差異化路線。

從萬卡集群到家庭中樞一套架構打穿

摩爾線程的產品矩陣看似跨度極大，實則共用同一套MUSA架構內核。這是“全功能GPU”路線首次在中國市場完成云邊端的完整落地驗證。

先看云端，這一次摩爾線程給出的是一套大模型訓練的硬件基座。

基于MTT S5000構建的夸娥萬卡智算集群已經商業化落地，幾個硬指標值得關注：Dense大模型訓練算力利用率（MFU）達到60%，MoE大模型達40%，訓練線性擴展效率95%，有效訓練時長占比超過90%。這幾個數字合在一起的意思是——它不僅能跑起來，而且已經是能真實支撐行業應用的水平。

數據指標層面，MTT S5000單卡AI算力（稠密）為1000 TFLOPS，配備80GB顯存和1.6TB/s顯存帶寬，作為國內最早原生支持FP8精度的訓練GPU，在DeepSeek-V4、Qwen3.5、GLM-5.1等大模型上實現了“Day-0適配”。面向更大規模的智算需求，摩爾線程第五代“花港”架構已發布，支持十萬卡級擴展。更大的算力集群，才能應對不斷膨脹的大模型算力支出。

再看端側，本次發布會的最大新品亮點是MTT AICUBE。

摩爾線程對MTT AICUBE的定義很清晰：不是AI PC，不是NAS，而是“家庭AI中樞”。產品形態上，AICUBE整合了“小麥”全域智能體、50TOPS異構本地算力和全閃存私有云，標配1TB SSD，支持7×24小時運行。小麥智能體集成了90余項CLI系統工具、60余項技能和36款以上APP的跨應用控制，依托摩爾線程自研的MTClaw開源框架，高頻工具調用成功率超過95%。

摩爾線程AICUBE的戰略意圖，非常值得關注。

它搭載的“長江”SoC是摩爾線程自研芯片，集成8個2.65GHz全大核CPU、全功能GPU和高能效NPU，136GB/s內存帶寬，最高支持64GB LPDDR5X。這顆芯片同時支撐AI計算、圖形渲染和視頻編解碼——這正是“全功能GPU”理念在終端的延伸。摩爾線程把算力從智算中心推向家庭場景，本質上是在Token時代對端側算力需求的提前卡位。從某種角度來說，MTT AICUBE有點像是對標谷歌音響。兩者區別是谷歌能直連gemini，而MTT AICUBE對模型的支持更加開放。

最后是邊緣側AI產品，摩爾線程帶來了MTT E300 AI模組，它具有50TOPS異構算力、-20°C至+65°C寬溫設計，面向工業質檢、能源巡檢、具身智能、低空經濟等場景。從全球范圍來看，MTT E300 AI模組跟高通今年主推的躍龍系列有點像，都是主打工業領域的AI算力需求。

整體下來，E300與AIBOOK（AI算力本）、AICUBE共同構成“長江”SoC的落地三角，覆蓋個人、家庭到行業。

結合云端萬卡集群的配置，展示出摩爾線程“云邊端”三層不是割裂的產品線，而是MUSA統一架構在不同算力密度下的三種形態。

全功能GPU路線摩爾線程在布局什么？

摩爾線程的真正差異化，不在于產品線全，而在于它選擇了一條國內罕有的“全功能GPU”技術路線。這個選擇背后，是摩爾線程對AI算力終局的一種判斷。

什么是全功能GPU？簡言之，它不是只做AI加速，也不是圖形GPU（渲染），而是單一芯片同時支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的統一架構。換句話說，就是類似英偉達的GPU能力。其他大多數GPU廠商這邊，其產品還是有些專門設計，例如AMD的AI芯片和圖形芯片分屬兩套不同架構。

為什么摩爾線程要選擇這條路線？因為，未來的AI不只是大模型訓練，而是數字世界與物理世界的深度融合。

具身智能行業的發展，已經證明了這一點。在機器人的訓練環節中，需要“算+渲+仿”三合一——AI計算訓練大腦、圖形渲染構建仿真環境、物理引擎模擬真實交互。這在傳統架構中，各環節是分開不同設備執行的，這就意味著開發者不得不在異構平臺間反復切換。而摩爾線程基于MUSA統一架構，用同一顆芯片就能完成全部任務，數據不再需要“傳來傳去”。

看到了這一機會，摩爾線程為具身智能專門推出了MT Lambda——國內首個全棧具身智能仿真平臺，深度融合物理、渲染、AI三大引擎。今年3月，摩爾線程開源了MuJoCo Warp MUSA，為物理仿真平臺MuJoCo提供了國產算力支持，在機器狗訓練任務中相較CPU方案實現最高40倍加速。與智源研究院合作，基于千卡S5000集群完成了RoboBrain 2.5具身大腦模型的端到端訓練，實測與國際主流GPU結果高度一致。與小馬智行、光輪智能、五一視界的合作也在密集落地。

摩爾線程在這個賽道的卡位，本質上是在賭一個判斷：物理AI時代，只有全功能GPU能同時支撐“思考”與“行動”兩種計算范式。

最后，依然是老生常談的國產GPU突破最重要的生態難題。在這一部分，摩爾線程也介紹了不少新的進展。

目前，MUSA SDK 5.1.0兼容CUDA 12.8，核心API兼容數達761，PyTorch全量3194個算子100%兼容。軟件工具層面，摩爾線程獲得了SGLang、vLLM、TileLang三大全球頂級推理框架的官方原生支持。這意味著國產GPU開始從“兼容可用”走向“被主流生態主動接納”。在開發者社區層面，目前摩爾線程也擁有45萬+的社區開發者和200+高校覆蓋，這些也能為長期生態建設提供了基礎。

但必須指出的是，生態建設沒有捷徑。從兼容CUDA到建立真正自主的MUSA原生生態，從跟隨到引領，這才是真正的長征。

結語

國產GPU的競爭正在從“有沒有”，進入“能不能打”的第二階段。

根據IDC數據顯示，2025年中國AI加速卡總出貨量約400萬張，其中國產廠商交付約165萬張，國產份額達41%。這組數據已經證明，中國GPU不僅能用，而且已經開始承擔AI算力市場的重要角色。

在這一變局中，摩爾線程作為對標英偉達的玩家，正在用統一架構打通云邊端，用全功能GPU卡位物理AI時代。至于統一架構能否支撐摩爾線程從“國產替代”真正走向“國際競爭”？接下來AICUBE的京東預售數據和夸娥集群的訂單增速，會在今年給出初步答案。

或許，摩爾線程的未來仍然是辛苦的。

根據公司財報顯示，摩爾線程2025年營收15.06億元、同比增長243%，2026年一季度營收7.38億元、同比增長155%——高增速背后，是摩爾線程從“賣芯片”向“賣算力基礎設施”的轉型加速。

但無論如何，摩爾線程已經證明了一件事：國產GPU不僅可以追隨，也可以嘗試定義一條屬于自己的技術路線。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.