<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      1B 參數跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進化,提速 AGI 進程

      0
      分享至


      AI“自造”時代開啟,端側算力迎來“工業母機”。

      作者丨高允毅

      編輯丨岑峰 馬曉寧

      在萬億參數的軍備競賽中,全球 AI 行業正陷入算力受制、高質量數據枯竭、電力成本飆升的資源消耗戰。當北美巨頭們斥資數十億美元狂賭超算中心時,中國的一支 AI “特種部隊”正繞開物理瓶頸,切入另一條決定勝負的岔路。

      在資源有限的背景下,想讓大模型的能力繼續狂飆,唯一的解法就是從底層改變研發模式,大幅壓縮每一代模型的迭代成本與周期。基于這一共識,“AI 制造 AI”的技術路徑應運而生。

      面壁智能發現,大模型進化速度,正面臨一個隱形的天花板,即“碳基程序員”手寫代碼的生理極限。如果底層的訓練框架持續依賴人工迭代,智能的進化速度就會被永遠鎖死。

      正如 AI 大神 Andrej Karpathy 提出的“自動研究員”設想,行業的底層共識正在發生根本性轉移:破局的關鍵不再是盲目堆砌算力,而是讓 AI 接管編碼,激活“遞歸自我改進”的速率爆發。一旦“AI 研發 AI 的速度”超越了“人類研發 AI 的速度”,人類距離 AGI 的時間將被大幅縮短。

      2026年5月25日,面壁智能正式交出答卷——全球首個由“AI創造AI”孕育而生的基座模型MiniCPM5-1B震撼發布。


      01


      MiniCPM5-1B的越級性能與端側革命

      作為“AI 創造 AI”的時代首作,MiniCPM5-1B一登場,就讓人眼前一亮。

      首先是堪比行業標桿的“越級性能”。作為一款參數量極小的 1B模型,它在綜合知識儲備、邏輯推理與工具調用等長板能力上,展現出了極高的參數利用率。在國際權威第三方評測機構Artificial Analysis (AA) 最新發布的榜單中,MiniCPM5-1B綜合分位列「小尺寸模型」榜單第一,成為了全球 2B 參數規模以內最強的開源基座模型。

      這一跨代級的性能飛躍,在對比中尤為顯著,它僅憑一半的參數量,便超越了 3 個月前的主流 2B 級別模型,用事實有力地驗證了面壁“智能密度約每 3.5 個月翻一番”的行業定律。


      圖注:MiniCPM5-1B在Artificial Analysis 智能指數輕量級大模型性能排行第一


      圖注:MiniCPM5-1B在 Artificial Analysis “模型智能與輸出 Token 消耗量”對比圖

      在衡量“奧賽級”代碼能力的 LCB-Pro 25Q2 (Easy) 測評中,它以 22.68 的高分遙遙領先,而在奧林匹克競賽級數學推理測試 AIME-2025/2026 中,它同樣斬獲了 40.42 的高分。


      圖注:MiniCPM5-1B與同體量模型評測結果對比圖

      其次,是釋放應用潛能的“極致壓縮比”。與云端那些動輒需要千卡集群支撐、高不可攀的API不同,MiniCPM5-1B天生具備極強的“生存能力”,支持 CPU 和瀏覽器運行,日常設備都能輕松駕馭。

      在 FP16 高精度下,它僅占約 2GB 內存;而在極限的 INT4/Q4 量化下,更是被壓縮至驚人的 0.5GB且幾乎無損。


      圖注:MiniCPM5-1B在不同精度下的權重體積與推薦部署場景

      這極大降低了開發者的部署門檻,讓“人人擁有一個聰明的賽博桌寵”與端側全能助手成為現實。

      圖注:MiniCPM5-1B落地端側應用,低載、常駐“賽博桌寵”演示

      項目地址:https://github.com/OpenBMB/MiniCPM-Desk-Pet

      (本項目基于clawd-on-desk項目二次開發)

      最后,是模型表現出的均衡能力。在與同等體量的模型對比中,MiniCPM5-1B在七個評估維度中名列前茅,展現了“六邊形戰士”般的整體實力。其中,在智能體和代碼編程領域大幅領先,在邏輯推理、數學推理、綜合知識方面也優勢明顯。


      圖注:MiniCPM5-1B與同體量模型各領域能力維度對比圖

      那么問題來了:為什么一個體量如此小巧的模型,卻能打破“小參數=低智能”的魔咒?這并非單純的參數微調,而是源于面壁智能重構的一套由“模型、框架、數據”并駕齊驅的全新自進化范式。


      02


      模型、框架、數據:面壁AI自進化范式三駕馬車

      MiniCPM5-1B之所以表現驚艷,根源在于其底層采用了面壁智能提出的全新軟件工程范式,“Forge Engineering”(鍛造工程)。

      它讓“AI 制造 AI”從前沿的實驗室概念,真正落地為了可復用的工業化流水線。

      放眼全球,“AI 制造 AI”的探索正在快速推進。從 Anthropic 用智能體編寫 C 編譯器,到 OpenAI 的 Harness 規約工程,再到 Andrej Karpathy 提出的“自動研究員”構想,這些嘗試都在不同方向上驗證了 AI 自主編程的可行性。

      然而,在難度最高、架構最復雜的“完整訓練框架”這一粒度上,已有嘗試大多停留在研究原型或局部工具鏈層面。例如,英偉達的 VibeTensor 官方明確標注為“研究級系統”,不適合生產使用;Anthropic 的 C 編譯器規模較小;OpenAI 的 Harness 更側重于規約方法論而非完整框架。 相比之下,面壁發布的 ForgeTrain,是目前已知首個完全由 AI 編寫、并已成功訓練出工業生產級模型(MiniCPM5-1B)的大模型訓練框架。

      ForgeTrain,可以被理解為“AI版 Megatron”。

      Megatron 是過去幾年大模型訓練領域最具影響力的工業標準之一,而 ForgeTrain 背后的 Forge Engineering 范式,則重構了傳統軟件工程的核心邏輯:

      當 AI 生成代碼的成本趨近于零時,行業不再需要長期維護臃腫的通用框架。面對新的硬件或模型,Forge Engineering 可以讓 AI 直接“按需生成”專用的極致優化代碼。

      可以說,面壁率先在業內跑通了“AI制造AI”任務中這個由算法(模型)、算力(Infra/框架)、數據三駕馬車環環相扣湊成的遞歸閉環。參照行業對“AI制造AI”進化能力的L1-L5梯度劃分,面壁正向自改進的 L4 階段發起全面沖鋒。

      在算力/Infra層,打造動力澎湃的發動機:AI 徹底告別了人類手寫代碼的局限,能夠針對特定硬件,動態地“現場鍛造”出專屬的最優算子與分布式策略。

      ForgeTrain 提供了一套由 AI 生成訓練框架的工程實現。 在實際使用中,人類設定目標,例如“在昇騰 910B 上訓練 1B 模型”,后續的代碼生成、測試與調優均在 AI 主導的閉環中完成。ForgeTrain 是該范式下的首個訓練框架實例,在一定條件下實現了針對特定場景的定制化生成,部分緩解了通用框架在效率與適配之間的權衡問題。

      在數據層,提煉高純度的燃油:優秀的模型離不開高質量的數據。ForgeTrain 解決了“怎么訓”的效率問題,而面壁的分級數據治理與大規模合成數據(超 1T Tokens,中文部分開源最大)則解決了“用什么訓”的質量問題。兩者結合,才造就了 MiniCPM5-1B 的驚艷表現。

      面對高質量數據日益枯竭的行業痛點,面壁與清華、OpenBMB聯合推出了 L0-L4 模型驅動分層數據管理框架。這套體系摒棄了傳統的粗放式清洗,通過“人類定義標準、AI 執行操作”的邏輯將數據精準分級,將數據從原始資源到結構化知識精準分為五級。


      圖注:面壁智能與清華、OpenBMB聯合提出 L0–L4 分級數據治理框架

      其中,L1 階段通過工程化方法完成基礎清洗和去重,L2階段針對特定任務或領域篩選出相關數據,構建模型的基礎語言與邏輯能力。

      而在關鍵的 L3 階段,面壁讓 AI “自主擇數”,對海量網頁與數學語料進行系統性編輯與合成,識別出更接近第一性原理的數據。

      而 L4 則轉化為可驗證的結構化知識,為 RAG 系統提供事實支撐。

      實驗效果是十分驚人的,在相同的訓練算力下,使用 L3 數據訓練的模型比使用傳統 L1 數據的模型,數學能力提升了 7.06pp,而這種提升還能跨域遷移到英文、中文和代碼任務上,通用推理能力平均提升超過 3pp。

      此外,分級管理也徹底重塑了訓練策略。當采用 “先 L1 筑基、再 L2 強化、最后 L3 拔高” 的分級訓練策略時,同樣 120B Tokens 的數據量,整體性能比傳統混合訓練提升了 1.49pp,后期訓練效率更是達到了混合策略的 1.7 倍。

      高質量合成數據不僅可以替代天然數據,在很多方面甚至優于天然數據,這將為解決數據枯竭問題提供系統性方案。 基于這一流程,團隊開源了 Ultra-Fineweb-zh-L3 數據集,包含超過 1T Tokens(其中中文約 410B Tokens),不僅服務于面壁自身的模型訓練,也將這套數據提純能力開放出來,反哺社區生態。

      這也是目前開源社區中規模最大的中文預訓練合成數據集之一。

      在算法/模型層,驅動自進化飛輪:AI 編寫的框架加上 AI 提純的高質量數據,最終孕育出了更強大的基座模型(MiniCPM5-1B)。

      一個更聰明的基座模型,本身也具備更強的代碼生成能力與數據理解能力。這意味著,它可以用 ForgeTrain 同樣的方法,生成比當前版本更優的訓練框架,也可以從海量語料中篩選出比當前 L3 數據集更高質量的訓練數據。 用新框架 + 新數據,又能訓練出下一代更強的模型。如此循環往復,形成一個“模型越強 → 框架與數據越優 → 下一代模型更強”的自進化飛輪。這正是面壁“AI 制造 AI”閉環能夠加速運轉的核心機制。

      在這套體系的全面落地中,ForgeTrain 交出了實質性的工程數據:

      在“零人工代碼介入”的硬約束下,面對國產算力,它僅耗時 3-5 天便跑通華為昇騰系列,跨越了底層適配的周期長考;在頂尖算力端,其生成的純 AI 代碼在英偉達 H100 上的訓練速度超越標桿 Megatron 10%,直接等效降低 10% 算力成本。

      ForgeTrain在華為昇騰上預訓練MiniCPM5-1B,相比昇騰的MindSpeed框架也有10%的加速。而基于該框架訓練的 MiniCPM5-1B性能反超同級基準。

      這背后的商業價值不言而喻:當企業需要為某款芯片(比如國產芯片)或某個端側場景做模型時,不需要請專門的技術團隊花幾個月去手動調優。只要告訴系統需求,AI 就能在幾天內為特定端側設備“現場鍛造”一套最契合的專屬模型和專屬訓練/推理框架,真正將模型訓練從“手工作坊”帶進了“工業流水線”時代。


      03


      重塑國產算力的底層軟件棧

      在國際地緣博弈的背景下,英偉達萬億市值的真正護城河,并不在于 GPU 硬件本身,而在于其背后經過十幾年積累、由百萬開發者共同構建的 CUDA 軟件生態。

      正如創始人黃仁勛自己所承認的:“英偉達本質上是一家軟件公司。” 確實,如果沒有這套涵蓋算法庫、編譯器、開發工具在內的完整生態系統,再強大的芯片也無法高效運行客戶的業務。

      當前,以華為昇騰為代表的國產異構芯片在硬件算力與架構創新上發展迅猛,展現出強大的硬件潛力。然而,隨著新算法與新芯片層出不窮,異構計算的 "組合爆炸" 已成為全行業的適配難題。從手機里的異構芯片,到驅動萬億參數大模型的上萬張加速卡集群,問題的本質沒有變,只是復雜度呈指數級放大。

      面對這一底層困局,整個高性能計算(HPC)行業苦苦摸索了近十年。

      行業曾嘗試通過傳統編譯器抹平異構差異,但傳統編譯器極度依賴人類專家提前寫好優化規則。但面對如今海量的硬件和算法組合,人力根本無法覆蓋所有可能性。這導致生成的代碼性能,通常只能觸及人類手寫極致代碼的 70%-80%。

      另一種方法是行業嘗試讓AI自動寫底層代碼,結果卻變成了“盲拼樂高”,AI往往只能做好局部的單個功能,一旦要把這些功能組裝成一個大系統,接口之間就會互相沖突,最終導致系統崩潰。

      在人類試圖用規則掌控硬件的時代,頂級科學家陳天奇主導的 TVM,成為了那個時代最引人矚目的突破;而到了 AI 自動生成軟件的新時代,NVIDIA 實驗室推出的VibeTensor,用AI完整寫出深度學習系統軟件,更是為行業后續探索鋪平了道路。而面壁智能今天的突破,正是站在了前人的肩膀上,補齊了工業級落地的最后一塊拼圖。

      VibeTensor和ForgeTrain的故事,生動地演示了在AI生成軟件的新時代中,僅靠模型本身的能力是遠遠不夠的。成功的關鍵,在于如何設計一套能有效約束和引導AI的“游戲規則”。

      ForgeTrain通過在限定范圍、明確目標、自動驗證的工程范式下取得了成功,而VibeTensor則在更廣闊、更模糊的空間里,為我們揭示了未來的挑戰,同樣意義重大。它們分別代表了AI在軟件工程領域的兩種探索路徑,共同推動著這個領域的進步。

      通過 ForgeTrain 的范式創新,國產芯片終于不必再去痛苦地像素級模仿、追趕英偉達的 CUDA 生態,也不必在傳統編譯器的死胡同里耗盡心血。

      隨著這一技術有望徹底重寫昇騰的底層軟件棧,它不僅將實質性解決“國產卡難用”的工程瓶頸,更在戰略層面上,為中國 AI 產業提供了一條繞過英偉達 CUDA 生態壁壘、實現底層軟件解耦的非線性突圍路徑。


      04


      “端側大模型開源狀元”的堅持

      2024年,面壁智能提出大模型“密度定律”(Densing Law ):大模型的最大智能密度,大約每 100 天就會翻一倍。在“密度定律”的指引下,面壁智能自然而然地選擇了一條與北美巨頭完全不同、追求極致智能密度的道路。

      回顧面壁智能的探索史,從 2024 年初的 MiniCPM 1.0開始,這支“小鋼炮”家族就在不斷刷新大模型“以小博大”的物理極限。憑借極小的參數量,先后越級超越 Llama2-13B 與 GPT-3.5,并將端側推理速度一路提升至最高 600 Token/s 的行業巔峰。

      憑借在端側模型上毫無保留的貢獻,面壁智能毫無疑問是“中國端側大模型開源狀元”。

      今天,MiniCPM5-1B的發布,不僅僅是一個好用的小模型問世,其背后的Forge Engineering就是這種思維的延續,更是一種全新 AI 生產力范式的宣告。

      當大模型能夠自主鍛造底層框架,研發與適配的軟件成本被 AI 壓縮到接近于零時,大模型將真正蛻變為全行業都能低成本接入、每一臺日常設備都能被智能點亮的普惠事業。

      當算力資源逐步向巨頭集中,面壁智能不僅堅持把強大的大模型壓縮到每個普通人的手機、電腦里,更試圖將制造大模型的“鐵錘”交還給 AI 自己。在通往AGI的道路上,一條無視算力封鎖、屬于中國大模型的自我進化飛輪已然開啟,屬于大模型自我進化的復利時代,已經到來。

      ForgeTrain開源鏈接:https://github.com/OpenBMB/ForgeTrain(5.26晚后上線)雷峰網

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      主力資金 | 5股尾盤獲主力逆市大幅搶籌

      主力資金 | 5股尾盤獲主力逆市大幅搶籌

      數據寶
      2026-06-01 19:39:19
      別不信!退休金拿到這個數,你就贏了

      別不信!退休金拿到這個數,你就贏了

      音樂時光的娛樂
      2026-06-01 05:44:50
      “這才是正常畢業生的就業現狀”,6個男生曬出路,大方承認平庸

      “這才是正常畢業生的就業現狀”,6個男生曬出路,大方承認平庸

      熙熙說教
      2026-06-01 19:30:50
      武統、和統都沒戲了?島軍事專家曾言:中國大陸已經走上第3條路

      武統、和統都沒戲了?島軍事專家曾言:中國大陸已經走上第3條路

      補懂事的孩紙
      2026-06-01 16:14:48
      大量上市,這3種菜鉀含量是蘋果8倍,6月使勁吃,腿腳有勁精神足

      大量上市,這3種菜鉀含量是蘋果8倍,6月使勁吃,腿腳有勁精神足

      秀廚娘
      2026-06-01 16:39:21
      竇靖童說從沒跟王菲吵過架,14歲退學王菲同意,但目前有點遺憾

      竇靖童說從沒跟王菲吵過架,14歲退學王菲同意,但目前有點遺憾

      小彭美識
      2026-05-30 19:38:07
      他汀藥有7種,只有一種不影響血糖,早知道早收益!

      他汀藥有7種,只有一種不影響血糖,早知道早收益!

      藥師方健
      2026-05-31 22:45:44
      若是我是否征召內馬爾?斯科拉里:這個問題還是讓安帥處理吧

      若是我是否征召內馬爾?斯科拉里:這個問題還是讓安帥處理吧

      懂球帝
      2026-06-01 13:30:21
      武漢知名男演員慶祝結婚10周年,胡歌、彭于晏當年是伴郎

      武漢知名男演員慶祝結婚10周年,胡歌、彭于晏當年是伴郎

      揚子晚報
      2026-05-30 20:00:01
      羅馬諾:阿森納今夏至少簽3人,買頂級邊鋒是他們的首要目標

      羅馬諾:阿森納今夏至少簽3人,買頂級邊鋒是他們的首要目標

      懂球帝
      2026-06-01 17:22:14
      僅200萬元!余承東官宣新尊界S800開啟預售后,奇怪的現象出現了

      僅200萬元!余承東官宣新尊界S800開啟預售后,奇怪的現象出現了

      春雨說科技
      2026-05-30 17:45:12
      醫生發現:早期腦梗不是頭暈,而是頻繁出現這5個異常,要警惕!

      醫生發現:早期腦梗不是頭暈,而是頻繁出現這5個異常,要警惕!

      芹姐說生活
      2026-05-31 12:48:00
      CBA總決賽前瞻:上海手握賽點沖冠 廣廈背水一戰盼奇跡

      CBA總決賽前瞻:上海手握賽點沖冠 廣廈背水一戰盼奇跡

      寒律
      2026-06-01 19:34:24
      不管你信不信,男性常喝白酒,基本都有如下6個現狀!要學會接受

      不管你信不信,男性常喝白酒,基本都有如下6個現狀!要學會接受

      醫學原創故事會
      2026-04-14 23:52:19
      湖人隊記:預計詹姆斯與里夫斯都會回歸 里夫斯續約優先級更高

      湖人隊記:預計詹姆斯與里夫斯都會回歸 里夫斯續約優先級更高

      北青網-北京青年報
      2026-06-01 20:34:32
      山東網友打算買龜,多個商家直言“山東不賣”,評論區全是電商淚

      山東網友打算買龜,多個商家直言“山東不賣”,評論區全是電商淚

      譚談社會
      2026-05-30 15:06:18
      演員蔡元元去世

      演員蔡元元去世

      環球時報國際
      2026-06-01 17:54:09
      杜聿明稱敗給粟裕是技不如人,但輸給毛主席,卻用了很重的四個字

      杜聿明稱敗給粟裕是技不如人,但輸給毛主席,卻用了很重的四個字

      野史日記
      2026-05-31 20:15:07
      王菲現實長什么樣?路人鏡頭才是照妖鏡,突然理解謝霆鋒的專一了

      王菲現實長什么樣?路人鏡頭才是照妖鏡,突然理解謝霆鋒的專一了

      臨云史策
      2026-06-01 11:35:00
      馬斯克妹妹成自己后媽,金發碧眼身材辣,與馬斯克76歲父親生二胎

      馬斯克妹妹成自己后媽,金發碧眼身材辣,與馬斯克76歲父親生二胎

      不似少年游
      2026-05-21 22:06:23
      2026-06-01 20:48:49
      雷峰網 incentive-icons
      雷峰網
      關注智能與未來!
      69567文章數 656138關注度
      往期回顧 全部

      科技要聞

      黃仁勛演講實錄|40年來PC首次重設計!

      頭條要聞

      媒體:鄭麗文"兩手空空"訪美 被指有望見到特朗普

      頭條要聞

      媒體:鄭麗文"兩手空空"訪美 被指有望見到特朗普

      體育要聞

      杰威:如果我沒受傷,我們能擊敗馬刺

      娛樂要聞

      奚夢瑤婚禮現場圖!一雙兒女當花童

      財經要聞

      宇樹過會,杭州贏麻了

      汽車要聞

      奇瑞集團5月銷量24.8萬輛 同比增長20.5% 出口18.2萬輛再創新高

      態度原創

      親子
      教育
      旅游
      本地
      數碼

      親子要聞

      孩子喝的奶,越貴越好嗎?

      教育要聞

      逐夢盛夏 全城護航 | 沖刺高考語文:聚焦核心考點 錯題復盤查缺補漏

      旅游要聞

      逛故宮的游客注意了,坤寧宮明起檢修請繞行

      本地新聞

      用剪紙的方式,打開江蘇揚州

      數碼要聞

      隱藏特性曝光:華為MatePad Pro Max“皇帝版”獨享衛星通信功能

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 综合亚洲网| 中文字幕一区二区人妻免费不卡| 亚洲中文字幕无码日韩| 亚洲第1色电影。| 疏附县| 久久久婷婷综合五月天| 国产一级区二级区三级区| 亚洲精品国产成人无码区在线| 国产一区国产精品自拍| 久久青青草原亚洲AV无码麻豆| 久久久精品人妻一区二区三区综合 | 久久国产成人午夜av影院| 欧洲lv尺码大精品久久久| 久久久国产精品VA麻豆| 欧美熟妇乱子伦XX视频| 一区二区在线观看成人午夜| 99re66| 极品人妻少妇一区二区| 婷婷四虎东京热无码群交双飞视频| 90后极品粉嫩小泬20p| 性一交一乱一乱一视频| 亚洲AV无码一区二区一二区色戒| 国产视频一区二区三区四区视频| 国产精品人成在线观看免费| 久久久亚洲精品一区二区三区| 麻豆国产精品一二三在线观看| 另类图片亚洲人妻中文无码| 国产玖玖视频| 亚洲色成人网站www永久下载| 三成人免费看| 少妇粉嫩小泬喷水视频| 久久视频在线视频精品| 91中文字幕在线观看| 男女啪啪高潮激烈免费版| 成人国产亚洲精品一区二| caoporn成人免费公开| 人妻中文字幕亚洲精品| 一区二区三区国产视频| 日本道久久综合88| 亚洲欧美日韩久久一区二区| 呦男呦女精品视频十区|