<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      最近,國產AI自己造了AI,全球首例!

      0
      分享至

      金磊 發自 凹非寺

      量子位 | 公眾號 QbitAI

      造AI這件事,現在的主角變成了AI。

      因為就在最近,一個國產AI先自己寫出了一套大模型預訓練框架,然后再用這套預訓練框架,訓練出了一個新的小尺寸模型!


      這就是面壁智能搞出來的big news。

      這套由AI寫出來的預訓練框架叫做ForgeTrain,它是全球首個完全由AI編寫的生產級大模型預訓練框架,性能甚至超越了英偉達的Megatron

      并且ForgeTrain在華為昇騰上預訓練MiniCPM5-1B,相比昇騰的框架也有10%的加速。

      圍繞它,面壁智能還提出了一套新的軟件編程范式,叫Forge Engineering

      更直白一點說,就是當AI寫代碼的成本越來越低,未來軟件不一定非要做成一套通用大框架,也可以針對不同模型、不同硬件、不同任務,現場鍛造一套專用代碼。

      而被ForgeTrain訓練出來的新模型,就是MiniCPM5-1B

      至于三者的關系,我們用一張圖來解釋:


      雖然過去行業里關于“AI制造AI”的聲音不斷,但總歸來說,都還停留在特定的環節,比如寫一段函數、改一個腳本、調一組參數等等。

      不過這一次,中國大模型公司第一次把“AI制造AI”從概念,推進到了可展示、可評測、可復現的工程樣本。

      AI造出來的AI,能干啥?

      既然MiniCPM5-1B是ForgeTrain訓練出來的模型,最直接的問題來了:

      AI造出來的AI,到底能干什么?

      先看一個最直觀的場景——桌寵

      這個1B參數規模的小模型,它可以常駐在電腦桌面上,變成一個隨時響應的AI小伙伴。你可以跟它聊天,讓它根據上下文接話,也可以給它設置不同的人格。

      (本項目基于clawd-on-desk項目二次開發:https://github.com/OpenBMB/MiniCPM-Desk-Pet)

      這個桌寵的重點在于,它不是一定要跑在云端的大模型服務,1B規模意味著它足夠小,部署門檻也足夠低。

      按照面壁智能官方的說法,MiniCPM5-1B在FP16精度下權重體積約2GB,適合GPU、高端筆電和服務器;INT4/Q4精度約0.5GB,可以面向手機、平板、車機等設備。

      MiniCPM5-1B想證明的,是1B模型也可以更能打。

      在綜合知識、數學推理、代碼推理、工具調用等方向上,MiniCPM5-1B都拿出了面向同尺寸端側模型的對比結果。

      公開評測中,MiniCPM5-1B/think平均分為42.57;在MMLU-Pro、MMLU-Redux、AIME-2025、AIME-2026、BFCL-v4、AA榜單等項目上,也給出了對應成績。


      尤其值得一提的是,MiniCPM5-1B再次刷新了小模型的智能密度上限。

      僅以1B參數規模,它就在國際知名榜單AA-Index上超越了所有2B參數以下模型。相比3個月前發布的Qwen3.5-2B,MiniCPM5-1B不僅效果更優,參數量還減少了一半。

      這背后其實指向一個越來越清晰的趨勢:模型能力提升,不再只靠把參數規模越堆越大。更小的模型,也正在承載更高的智能密度。按照這一趨勢觀察,大模型的智能密度正在以約每3.5個月翻一番的速度持續提升。


      這也讓MiniCPM5-1B的價值更明確了,它不只是一個小尺寸模型,而是一個在參數規模、部署成本和實際能力之間重新找平衡點的端側模型。

      除此之外,它還可以自定義人格

      雖然這聽起來像聊天產品里的基礎功能,但在端側模型上意義更大,因為端側模型離用戶更近,更容易成為本地設備上的輕量級智能入口。

      它可以記住用戶偏好的交互方式,也可以根據不同場景切換風格。

      如果大模型要從云端走向每個人的設備,模型必須足夠小、足夠便宜、足夠好用,還要有完整工具鏈。

      這也是它強調開發者友好的原因。

      MiniCPM5-1B提供了模型、推理、微調相關工具鏈。推理側支持SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight等;微調側支持LLaMA-Factory、ms-swift等工具。

      對開發者來說,這比單純給一個模型權重更重要。

      因為模型能不能被用起來,往往不只取決于模型本身,也取決于部署、推理、量化、微調、接入工作流是不是順手。

      還超過了英偉達Megatron

      如果說MiniCPM5-1B是AI制造AI的產品,那么ForgeTrain就是AI制造AI的工廠。而這個工廠,本身也是AI造出來的。

      面壁智能把AI制造AI分成了L1到L5五個階段:


      • L1:AI 只給建議,人類執行所有操作(代表:Github Copilot)

      • L2:AI 輔助研發,完成具體環節(代表:Cursor,Claude Code)

      • L3:AI 端到端產出下一代模型(代表:ForgeTrain)

      • L4:AI 遞歸自改進,改造訓練管線和自身

      • L5:AI 自主設定研究議程,開放式探索


      ForgeTrain對應的正是L3-L4這個階段。它還沒有到AI自己發明下一代Transformer的程度,但它已經進入了大模型研發最核心的基礎設施層——預訓練框架。

      在此之前,全世界很多大模型預訓練框架,都是人類程序員一行一行寫出來的。英偉達的Megatron、Meta的 Fairseq、谷歌的TensorFlow,無一不是如此。

      但面壁智能提出了一個完全不同的思路,Forge Engineering

      過去的軟件工程強調通用框架,一個框架要兼容各種模型、各種硬件、各種訓練任務。好處是代碼可以復用,代價是很難把每個具體場景都壓榨到極致。就像一件均碼的衣服,誰都能穿,但誰都穿不合身。

      Forge Engineering的思路則激進得多:既然AI寫代碼越來越快,代碼生產成本越來越低,那我們為什么還要追求通用?我們完全可以給不同的模型、不同的硬件、不同的任務,分別寫專用的代碼。

      這就像從工業化的批量生產,回到了高級定制。AI就是那個不知疲倦的頂級工匠,可以為每一個需求量身打造最適合的代碼。

      但AI自己寫預訓練框架,難點不只在寫代碼。更難的是:它怎么知道自己寫對了?怎么知道速度夠不夠快?怎么知道顯存、并行、通信、穩定性有沒有問題?

      這就需要Harness

      咱們可以把Harness理解成一個考場,AI被放進這個考場里,一輪輪生成代碼、運行測試、拿到反饋、繼續修改。這個過程完全自動,不需要人類干預。

      面壁智能采用了三階段構建方法論:

      1.從現有預訓練框架采集關鍵數據,形成評測標準和Harness

      2.從評測Harness構建二進制一致的預訓練框架版本

      3.解除二進制一致的限制,迭代優化到超越參考實現

      最終的結果是,ForgeTrain不僅在功能上完全對齊了英偉達Megatron,而且在相同的硬件條件下,訓練速度還要快10%。

      這意味著,同樣的算力,用ForgeTrain可以節省10%的訓練時間和成本。

      這是一件值得被重視的事情

      看到這里,你可能覺得這是一場很酷的技術秀。但透過現象看本質,面壁智能的這次發布,正在揭示大模型行業正在發生的一場劇變。

      首先,大模型的競爭,正在從堆資源走向極致提效率。

      過去幾年,所有大模型廠商都在拼大力出奇跡,拼參數、拼語料、拼算力、拼十萬卡集群。但這條Scaling Law的路,它是有盡頭的。

      當堆料走到天花板,接下來的勝負手是什么?是效率。

      在同樣的算力預算下,誰能產出更多的研發迭代?誰的單代研發周期更短?面壁智能的AI制造AI給出了答案:

      用AI去替代人類研發管線中的重復勞動,把人類數周的代碼開發壓縮到幾十分鐘。這是唯一能對抗資源瓶頸,實現大模型能力繼續指數級攀升的解法。

      其次,AI研究員的角色,正在發生不可逆轉的改變。

      在ForgeTrain這樣的系統里,人類的角色正在發生遷移。從Human in the loop(在循環中執行具體代碼)變成了Human on the loop(在循環外進行監督和設計)。

      未來的AI科學家,不再需要親自去寫那無窮無盡的CUDA算子和底層通信邏輯。他們將變成研發系統的設計者和守界者。他們只需要定義目標、搭建Harness,剩下的臟活累活,全交給不知疲倦的AI去完成。

      最后,對于國產大模型和國產芯片而言,這是彎道超車的絕佳契機。

      過去,我們評價國產大模型,眼睛總是盯著參數大小、榜單跑分、長文本能力。但真正決定一家公司、一個生態長期核心競爭力的,其實是底層系統——生產模型的能力。

      誰能更快地訓練出模型,誰能以更低的成本試錯,誰就能在殘酷的百模大戰中活到最后。

      更深遠的戰略意義在于國產算力生態。眾所周知,華為昇騰等國產芯片在硬件算力上正在瘋狂追趕,但最大的短板在于軟件生態。英偉達有數以百萬計的開發者花了十五年時間踩坑、優化,這是國產芯片靠人力很難在短時間內抹平的差距。

      但ForgeTrain提供了一種破局的可能。

      如果人不夠,那就用AI來湊!通過AI自動生成適配各種新模型、新硬件的專屬預訓練框架,國產芯片將有機會借由AI的生產力,極大縮短追趕國際頂尖生態的時間差。

      當AI學會了造AI,齒輪就已經開始加速轉動。一個新的紀元,正在我們眼前展開。

      MiniCPM5-1B 現已全面開源:

      Hugging Face鏈接:

      https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B

      GitHub鏈接:

      https://github.com/OpenBMB/MiniCPM

      ModelScope鏈接:

      https://modelscope.cn/models/OpenBMB/MiniCPM5-1BAtomGit:https://ai.gitcode.com/OpenBMB/MiniCPM5-1B

      魔樂社區:

      https://modelers.cn/models/OpenBMB/MiniCPM5-1B

      ForgeTrain開源鏈接:

      https://github.com/OpenBMB/ForgeTrain

      本文經授權轉載自量子位ID:QbitAI),如需二次轉載請聯系原作者。歡迎轉發到朋友圈。

      點個“小愛心”吧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      歐冠決賽夜,這位美女主持人搶了鏡

      歐冠決賽夜,這位美女主持人搶了鏡

      樂道足球C
      2026-06-01 20:47:46
      奚夢瑤婚禮現場圖!一雙兒女當花童,四太笑的開心,谷愛凌也來了

      奚夢瑤婚禮現場圖!一雙兒女當花童,四太笑的開心,谷愛凌也來了

      美美賺錢
      2026-06-01 14:04:53
      重獎,韓足協主席宣布若球隊打進本屆世界杯8強將獎勵30億韓元

      重獎,韓足協主席宣布若球隊打進本屆世界杯8強將獎勵30億韓元

      懂球帝
      2026-06-01 18:27:23
      編劇汪海林再炮轟:中國電視劇里,為什么再也見不到一個正常男人

      編劇汪海林再炮轟:中國電視劇里,為什么再也見不到一個正常男人

      橙星文娛
      2026-06-01 11:08:30
      美伊談判,突發!伊朗計劃徹底封鎖霍爾木茲海峽!油價狂拉,黃金、白銀跳水!

      美伊談判,突發!伊朗計劃徹底封鎖霍爾木茲海峽!油價狂拉,黃金、白銀跳水!

      證券時報e公司
      2026-06-01 22:28:11
      廣州白云機場一航班落地滑行58分鐘?航旅縱橫顯示情況屬實,機場客服稱將調查

      廣州白云機場一航班落地滑行58分鐘?航旅縱橫顯示情況屬實,機場客服稱將調查

      上游新聞
      2026-06-01 18:27:16
      “一車安全帶全是P上去的”沖上熱搜,《這就是我的西游2》節目組被質疑嘉賓使用的安全帶為后期P圖添加;同類問題并非首次發生

      “一車安全帶全是P上去的”沖上熱搜,《這就是我的西游2》節目組被質疑嘉賓使用的安全帶為后期P圖添加;同類問題并非首次發生

      大風新聞
      2026-06-01 15:53:04
      你不知道的民國,一段了不起的傳奇,一個被雪藏的高光時代

      你不知道的民國,一段了不起的傳奇,一個被雪藏的高光時代

      史政先鋒
      2026-06-01 11:41:21
      給5歲女兒買11200元連衣裙,明明打對折,結果專柜收了全款!銷售求原諒:工資低也可憐;爸爸怒了:他們道德綁架!

      給5歲女兒買11200元連衣裙,明明打對折,結果專柜收了全款!銷售求原諒:工資低也可憐;爸爸怒了:他們道德綁架!

      揚子晚報
      2026-06-01 12:26:28
      英偉達:比亞迪、小米、小馬智行等均已采用或正在基于Hyperion平臺開發智駕

      英偉達:比亞迪、小米、小馬智行等均已采用或正在基于Hyperion平臺開發智駕

      財聞
      2026-06-01 13:07:09
      周六打虎,王益華落馬!任上落馬的正部級“老虎”,辭去職務

      周六打虎,王益華落馬!任上落馬的正部級“老虎”,辭去職務

      上觀新聞
      2026-06-01 13:18:08
      浙江國企“塌方”  高管批量投案

      浙江國企“塌方” 高管批量投案

      經濟那道理
      2026-06-01 15:55:26
      最高預售價200萬元尊界搭載國產朝陽輪胎引發熱議,余承東稱做高端拔高了中國汽車產業能力

      最高預售價200萬元尊界搭載國產朝陽輪胎引發熱議,余承東稱做高端拔高了中國汽車產業能力

      金融界
      2026-05-31 21:56:07
      伊朗公布世界杯26人名單:33歲國米舊將領銜 4人旅歐 阿茲蒙落選

      伊朗公布世界杯26人名單:33歲國米舊將領銜 4人旅歐 阿茲蒙落選

      我愛英超
      2026-06-01 21:14:05
      市場監管形同虛設!大量有毒根莖作物流入市場,蒜薹、土豆全程灌毒,農戶自己不吃

      市場監管形同虛設!大量有毒根莖作物流入市場,蒜薹、土豆全程灌毒,農戶自己不吃

      極目新聞
      2026-05-24 21:12:36
      DeepSeek預測:未來三年,普通家庭升值最快的3項資產,越早布局越好

      DeepSeek預測:未來三年,普通家庭升值最快的3項資產,越早布局越好

      十點讀書
      2026-06-01 19:23:36
      1100萬清洗!前巴薩10號離隊:巔峰身價8000萬 梅西接班人

      1100萬清洗!前巴薩10號離隊:巔峰身價8000萬 梅西接班人

      葉青足球世界
      2026-06-01 20:06:16
      河南13人死亡車禍后 :當地不少拼車群解散,有客運站被重申“嚴禁超員”丨封面深鏡

      河南13人死亡車禍后 :當地不少拼車群解散,有客運站被重申“嚴禁超員”丨封面深鏡

      封面新聞
      2026-06-01 19:10:28
      瘋了吧!雷霆+詹姆斯!直接宣布總冠軍吧...

      瘋了吧!雷霆+詹姆斯!直接宣布總冠軍吧...

      詹姆斯吧
      2026-06-01 14:52:52
      這跟不穿有啥區別!北京這一夜,31歲徐璐穿透視禮服,屬實辣眼睛

      這跟不穿有啥區別!北京這一夜,31歲徐璐穿透視禮服,屬實辣眼睛

      八斗小先生
      2026-05-29 19:24:16
      2026-06-01 23:56:49
      果殼 incentive-icons
      果殼
      科技有意思
      27747文章數 4149312關注度
      往期回顧 全部

      科技要聞

      黃仁勛演講實錄|40年來PC首次重設計!

      頭條要聞

      河南13人死亡車禍背后:有司機開不動了讓乘客代開車

      頭條要聞

      河南13人死亡車禍背后:有司機開不動了讓乘客代開車

      體育要聞

      杰威:如果我沒受傷,我們能擊敗馬刺

      娛樂要聞

      奚夢瑤婚禮現場圖!一雙兒女當花童

      財經要聞

      宇樹過會,杭州贏麻了

      汽車要聞

      奇瑞集團5月銷量24.8萬輛 同比增長20.5% 出口18.2萬輛再創新高

      態度原創

      親子
      旅游
      本地
      家居
      公開課

      親子要聞

      深圳六幼發布原創健康精靈IP動畫 以幼兒陶藝作品為主角

      旅游要聞

      逛故宮的游客注意了,坤寧宮明起檢修請繞行

      本地新聞

      用剪紙的方式,打開江蘇揚州

      家居要聞

      自信舒展 高背座椅

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 水蜜AⅤ视频一区二区三区| 日本九州不卡久久精品一区| 国产精品一区二区三区污| 欧美另类在线制服丝袜国产| 亚洲最大中文字幕无码网站| 精品亚洲国产成人| 国产又爽又黄无码无遮挡在线观看| 久久精品中文字幕有码| 亚洲va中文字幕无码久久不卡| 免费黄色大全一区二区三区| 国产91丝袜在线观看| 久久无码字幕中文久久无码| 国产一区二区不卡精品视频| 又粗又猛又黄又爽无遮挡| 肉色超薄丝袜脚交一区二区| 日本精品人妻无码77777| 中文字幕日韩精品有码| 日韩精品无码不卡无码| 国产亚洲成AV片在线观看| 国产成人久久精品流白浆| 久久综合色之久久综合色| 亚洲中文字幕播放视频| 色婷婷精品国产一区二区三区| 日本中文字幕在线在线| 午夜av福利一区二区三区| 3?p在线| 日日夜夜干| 亚洲在战AV极品无码| 99热精品毛片全部国产无缓冲| 久久精品亚洲| 久久久久久久97| 国产AV一区二区三区最新精品| 在线aⅴ亚洲中文字幕 | 国产做受| 成人午夜伦理在线观看| 丰满岳乱妇久久久| ts人妖暴力调教直男在线| 白丝美女办公室高潮喷水视频| 99精品国产精品一区二区| 亚洲18禁| 日韩无码一卡二卡|