DoNews6月1日消息,MiniMax 稀宇科技官網今日上線了 MiniMax M3 模型,宣稱是首個“Frontier Coding & Agentic · 百萬上下文 · 原生多模態”三項能力兼備的國產旗艦,第一個把完整前沿能力帶進開放世界的模型。
![]()
MiniMax M3 在編碼與智能體評測中達到“行業頂尖水平”,具備自主任務拆解、工具調用與多步推理能力,宣稱寫出的代碼目標是直接可交付,而不是“能跑但需要人改”。
基于自研 MiniMax Sparse Attention(MSA)架構,MiniMax M3 的 API 最高支持 1M tokens 上下文窗口,保障至少 512K tokens 可用。1M 上下文是長程 Agent、長程 Coding、長視頻理解的基礎設施。
MiniMax M3 是原生多模態模型,重構整個數據管線將預訓練數據規模擴充至百 T 量級,從第零步開始多模態訓練,使文本和視覺語義空間高度對齊。
![]()
在 BrowseComp 智能體評測中,MiniMax M3 以 83.5 分超越 Opus 4.7(79.3),展現出自主瀏覽與信息檢索能力。
此外,MiniMax M3 宣稱是第一個把完整 frontier 能力帶進開放世界的模型,能同時跑通編碼 SOTA、百萬上下文和原生多模態。
MiniMax 官方丟給 M3 一篇 ICLR 2025 杰出論文 — Learning Dynamics of LLM Finetuning,讓它獨立復現。M3 連續運行近 12 小時,全程自主產出 18 次 commit 與 23 張實驗圖表,成功跑通核心實驗。多模態看懂論文里的圖表公式,長上下文保證論文 + 代碼 + 實驗日志一次性進窗口,編程 + Agent 能力驅動長線程執行。
![]()
給 M3 四個只完成預訓練的 Base 模型,要求在 12 小時內自主完成數據合成、訓練、評測、迭代全流程,讓它們在數學推理、代碼生成、知識問答等任務上具備能力。整個流程全程無人干預,M3 最終得分 37.1,位列第三,僅次于 Opus 4.7(42.4)和 GPT-5.5(39.3)。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.