<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek三模型霸榜OpenRouter前十!月調用超17萬億tokens

      0
      分享至

      DeepSeek三模型霸占OpenRouter前十,月調用合計超17萬億tokens。Agent負載正在碾壓一切基礎設施!現在,自主創新的國產生態,正在悄悄改寫下一代AI基礎設施的入場券。

      打開OpenRouter最新的模型月榜,V4上線一個月,DeepSeek的存在感很強。

      V4 Flash月調用9.13T tokens,穩坐第1。V4 Pro也沖到了3.89T排第9。再加上V3.2的4.07T排第8,DeepSeek三個模型同時擠進前十,月調用合計超過17萬億tokens。



      應用方面,排名前兩位的Hermes Agent和OpenClaw,月調用量分別達到了10.8T和6.25T tokens。

      換句話說,如今Token消耗的絕對主力,已經從傳統的聊天機器人,徹底讓位給了會規劃、檢索、調用工具并反復驗證的Agent系統。

      它就像一個小型工作流,單次任務動輒觸發上百輪LLM調用,并伴隨數十次工具執行,再加上長記憶和自演進產生的數據,負載常常飆升至數百GB甚至TB級。

      這種以「萬億」為單位的高強度并發,正在將底層基礎設施的每一個短板都無限放大。

      而這,也呼應了幾個月前行業里流傳的一個似是而非的傳聞。

      當時DeepSeek V4的發布有所推遲,坊間便出現一種猜測,是不是因為V4在跟昇騰做底層的深度適配,拖慢了節奏?

      這甚至引發了一種錯覺,讓人以為昇騰正在成為某一家大模型廠商的「專有硬件」,不得不把大量精力耗費在特定模型的查漏補缺上。

      這恰恰是對算力底座和模型演進關系最大的一個誤解。

      DeepSeek V4之所以能在開源首日,真正做到「開箱即優」,并不是因為昇騰為了某款模型削足適履,而是因為LLM演進到今天,必然會撞上這幾堵墻。

      而昇騰,只是恰好提前在那里等它。

      面對整條賽道的共性需求,昇騰交出的是一套通用的答卷。

      就拿剛剛過去的4月來說,智譜GLM-5.1、MiniMax M2.7、DeepSeek V4三個頭部模型密集開源,昇騰全部做到了發布即支持。

      能做到這種覆蓋速度,唯一的解釋是,其底層的能力是高度通用的。

      昇騰的能力之所以能實現通用,是因為頭部模型走到了同一個路口。

      首先是MoE架構,它的好處是每次只激活一小部分專家來干活,計算效率高。但代價很明顯,專家分散在不同的卡上,每次推理都要大量卡間通信。

      精度方面,V4-Pro在HuggingFace上標注FP4+FP8混合精度,MoE專家參數用FP4,其他用FP8。低精度推理已經從「能不能壓縮」進入了「壓縮后是否可靠」的階段。

      通信、內存、精度,是各大頭部模型在部署時都會面臨的難題。

      而能夠系統性地解決這三件事的AI軟硬件平臺,將率先搶占下一代AI基礎設施的關鍵入口。

      MoE的關鍵在于,計算被稀疏化以后,通信變成了第一瓶頸。

      昇騰之前已經有MC2通算融合算子,在不同的并行方式下把矩陣計算和集合通信做了融合。

      在EP并行模式下,現有算子仍無法實現通信與Grouped Matmul計算的完全并行,因此并未達到真正的通算融合。

      MegaMoE補上的,正是這個缺口。

      它把MoE推理中原本分開執行的五個步驟(Alltoall Dispatch、GMM1、Swiglu、GMM2、Alltoall Combine)融成一個大算子,讓通信和計算盡可能同時進行。同時支持Prefill和Decode場景。

      昇騰Atlas 800 A3上的實測數據顯示,DeepSeek V3.1和Qwen3-235B兩個模型接入MegaMoE融合算子后,Prefill場景可獲得20%到30%的性能提升,Decode場景也有10%以上的收益。

      Prefix Cache(前綴緩存)是當前大模型推理服務中廣泛使用的優化技術。

      但單機的Prefix Cache有一個根本局限,緩存只存在本機本地內存里。容量有限,容易被淘汰。更關鍵的是,跨機器的實例之間完全不共享,集群越大,緩存利用率反而越低。

      而多機部署、PD分離、大規模專家并行,恰恰是所有萬億級MoE模型的標準部署方式,并且都對多機間的內存共享和數據調度提出了更高要求。

      為此,昇騰提出了全新的KVCache池化方案,框架層通過KV Connector對接池化后端,去除冗余的三方轉發層。

      同時,長序列還有一個更底層的壓力。

      在業界的普遍認知中,Prefill階段的計算量隨序列長度呈平方級增長,Decode階段的KVCache內存占用則隨序列長度線性增長,長序列同時帶來計算和內存的雙重瓶頸。

      對此,昇騰采用了PCP做Prefill階段的算力切分,DCP做Decode階段的KVCache內存切分,兩者配合把雙重壓力同時分攤開。

      通信和內存之外,精度是第三個繞不過去的難題。

      傳統量化方式(INT4/INT8/FP8)用全局統一縮放因子,相當于一把尺子量所有參數,碰到異常值整個縮放范圍就被拽偏了。

      在參數分布差異極大的MoE模型中,這一問題尤為致命。

      為了解決這個矛盾,行業正在向Microscaling格式(MXFP4/MXFP8)收斂。它的原理是把參數分成小組,每組用獨立縮放因子,異常值只影響本組,不拖累全局。

      但光有格式標準還不夠,關鍵是硬件和工具鏈能不能跟上。

      昇騰950系列創新性地在架構層面提供了專用的塊縮放因子計算單元和MXFP矩陣乘法加速器,從硬件層原生支撐mx格式。

      再往上,MindStudio工具支持一鍵生成MXFP4/MXFP8模型權重,開發者不需要手動處理量化細節。

      從硬件到工具鏈全部打通之后,任何想走MXFP路線的模型,在昇騰上都能快速適配。

      從低精量化到長序列池化再到MoE通算融合,這三個方向看似各自獨立,但背后對應的是同一個命題,Agent時代的推理基礎設施該怎么建。

      而在這個命題上,昇騰全系列產品不僅已經實現了對DeepSeek的全面支持,更讓人看到了V4背后的一條完整鏈路,從底層芯片、底層編程語言到核心算子,關鍵環節都有中國自己的方案。

      可以說,DeepSeek V4的出現,印證了中國已經可以依靠一整套自主創新的生態體系來打造頂尖大模型。

      而昇騰,正是這條生態鏈路上的算力底座,一個面向全行業的通用AI軟硬件平臺。

      Agent時代的推理負載還在膨脹,下一個萬億級模型隨時會來。這個平臺能接得住的,遠不止DeepSeek。

      聲明:個人原創,僅供參考

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      事業沒了,婚也離了!封殺5年后趙薇罕見露面,原來她早留好退路

      事業沒了,婚也離了!封殺5年后趙薇罕見露面,原來她早留好退路

      笑談歷史阿晡
      2026-05-05 06:05:31
      最新 | 蔡依林天津演唱會取消!情況說明→

      最新 | 蔡依林天津演唱會取消!情況說明→

      天津人
      2026-06-23 14:29:10
      吃錯藥鬧烏龍!羅永浩怒撕百萬醫療大V博主:流量流氓

      吃錯藥鬧烏龍!羅永浩怒撕百萬醫療大V博主:流量流氓

      雷科技
      2026-06-22 17:39:06
      具俊曄結束在臺醫美代言 不續約原因曝光…診所院長證實發聲

      具俊曄結束在臺醫美代言 不續約原因曝光…診所院長證實發聲

      ETtoday星光云
      2026-06-23 09:39:04
      莫斯科再遭大規模空襲!俄四大機場全部關閉

      莫斯科再遭大規模空襲!俄四大機場全部關閉

      項鵬飛
      2026-06-22 20:13:48
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      健康科普365
      2026-05-09 21:05:04
      兜里揣著現金去花橋抄底的人,現在怎么樣了?

      兜里揣著現金去花橋抄底的人,現在怎么樣了?

      說故事的阿襲
      2026-06-23 07:47:59
      開20年麻將館,我看透了:天天泡牌桌的人,終究逃不過這3種結局

      開20年麻將館,我看透了:天天泡牌桌的人,終究逃不過這3種結局

      千秋歷史
      2026-05-28 19:29:11
      全員暴走!“梅姆哈”輪番梅開二度刷新紀錄,獨留C羅深陷進球荒

      全員暴走!“梅姆哈”輪番梅開二度刷新紀錄,獨留C羅深陷進球荒

      田先生籃球
      2026-06-23 10:30:09
      雄鹿拒絕綠軍真因曝光!老板怕布朗來了明年也想走

      雄鹿拒絕綠軍真因曝光!老板怕布朗來了明年也想走

      體壇周報
      2026-06-23 13:07:21
      徹底掀翻行業!比亞迪固態電池實錘落地,續航1218公里!

      徹底掀翻行業!比亞迪固態電池實錘落地,續航1218公里!

      阿芒娛樂說
      2026-06-22 11:25:27
      哪一瞬間讓你覺得沒文化真可怕?網友:上海交大畢業后是當交警的

      哪一瞬間讓你覺得沒文化真可怕?網友:上海交大畢業后是當交警的

      另子維愛讀史
      2026-06-02 10:54:14
      WPS被罵上熱搜!占滿C盤致電腦卡頓,商業套路被扒,遭網友怒斥!

      WPS被罵上熱搜!占滿C盤致電腦卡頓,商業套路被扒,遭網友怒斥!

      譚談社會
      2026-06-21 19:10:56
      于東來曬胖東來半年成績單:16店狂收139.5億 據河南零售榜首僅一步之遙

      于東來曬胖東來半年成績單:16店狂收139.5億 據河南零售榜首僅一步之遙

      快科技
      2026-06-23 09:18:26
      小米高管回應雷軍擺拍風波:這事都兩年了

      小米高管回應雷軍擺拍風波:這事都兩年了

      熱搜摘要官
      2026-06-23 01:14:08
      談了18個小時!終于迎來結果,伊朗代表當場破防,全程咬牙沒離場

      談了18個小時!終于迎來結果,伊朗代表當場破防,全程咬牙沒離場

      鐵錘簡科
      2026-06-23 12:52:12
      民調92%支持率,鄭麗文振臂一呼,馬英九終獲道歉

      民調92%支持率,鄭麗文振臂一呼,馬英九終獲道歉

      明天見灌裝冰塊
      2026-06-23 13:21:00
      王耀南途中擊斃野狼,參謀不解其意,數月后日軍才恍然大悟

      王耀南途中擊斃野狼,參謀不解其意,數月后日軍才恍然大悟

      嘮叨說歷史
      2026-03-17 12:58:37
      “他是我們家的參天大樹!”外孫患病只剩18個月,特效藥70萬一針,外公悉心照顧“續命”9年:女兒剛40歲,頭發白了大半,能幫一把是一把

      “他是我們家的參天大樹!”外孫患病只剩18個月,特效藥70萬一針,外公悉心照顧“續命”9年:女兒剛40歲,頭發白了大半,能幫一把是一把

      都市快報橙柿互動
      2026-06-23 02:51:06
      能否爭冠?熱火交易后首發陣容仍有缺陷 防守強悍進攻端難有保障

      能否爭冠?熱火交易后首發陣容仍有缺陷 防守強悍進攻端難有保障

      驚奇侃球
      2026-06-23 15:06:22
      2026-06-23 15:20:49
      風格豆腐干
      風格豆腐干
      風格豆腐干
      718文章數 45關注度
      往期回顧 全部

      科技要聞

      48名中國開發者聯名舉報蘋果

      頭條要聞

      五眼聯盟警告:西方AI優勢或在數月內被趕超

      頭條要聞

      五眼聯盟警告:西方AI優勢或在數月內被趕超

      體育要聞

      哈蘭德國家隊52場59球 世界杯狂刷6大紀錄

      娛樂要聞

      喜劇大師曝光肖戰拍戲狀態!

      財經要聞

      智譜萬億市值,國產Anthropic真來了?

      汽車要聞

      華為智駕ADS限時優惠月底結束 7月1日前下訂立省3000元

      態度原創

      時尚
      房產
      教育
      藝術
      數碼

      今年夏天一定要擁有的6條絕美裙子,太好看了!

      房產要聞

      一年時間,36個盤“消失”!海口樓市,罕見“大收縮”!

      教育要聞

      如何用10本好書,重構你的專業成長之旅?

      藝術要聞

      90后川妹子獨居成都三層小樓,不裝窗簾,活得太自在了

      數碼要聞

      三星發布全球首款UFS 5.0閃存:讀取速度10.8GB/s、能效提升40%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 肏屄的视频| 国产又爽又黄又不遮挡视频| 亚洲欧洲日韩国内精品| av资源站| 亚洲不卡网| 国产免费拔擦拔擦8X高清在线人| 国产精品揄拍一区二区久久| 中文字幕在线观看网址| 米奇激情久久网| 麻豆av在线| 亚洲 国产 制服 丝袜 一区| 国产AV影院| 午夜无码区在线观看| 日韩欧美中文字幕在线观看| 40岁大乳的熟妇在线观看| 日本色导航| AV天堂色| 97青青青国产在线播放| 精品亚洲无人区一区二区| 人妻中文字幕精品系列| 在线观看无码av免费不卡网站| 亚洲国产精品线播放| 国产区二区三区在线观看| 亚洲欧美综合人成在线| 国产特级毛片aaaaaa高清| 美女一区二区在线观看| 色偷偷亚洲男人的天堂 | 丰满人妻在线一区二区三区| L日韩欧美看国产日韩欧美| 91久久性奴调教国产免费| 国产精品中文字幕av| 国产suv精品一区二区69| 国产精品成人自拍视频| 激情伊人五月天久久综合| 久久一日本道色综合久久| 久久被窝亚洲精品爽爽爽| 欧美黑人性受xxxx精品| 免费国产一区二区不卡| 日本狂喷奶水在线播放212| 欧美亚洲国产丝袜在线| 无码色亚洲|