<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      新版本發(fā)布,DeepSeek再掀效率革命|甲子光年

      0
      分享至



      更便宜、更快,向Agent和國產(chǎn)替代更進一步。

      作者|衛(wèi)琳聰 周悅

      終于,DeepSeek-V4 來了。

      距離上次版本發(fā)布已經(jīng)過去近5個月,期間多次有DeepSeek新版本發(fā)布的消息傳出,但都干打雷不下雨,等待的空氣里不免泛起一些懷疑。

      4月24日,DeepSeek-V4 預覽版正式上線并同步開源,官方新聞稿里直接宣稱“邁入百萬上下文普惠時代”。

      此次發(fā)布的版本包含兩款MoE語言模型——DeepSeek-V4-Pro和DeepSeek-V4-Flash。

      前者總參數(shù)1.6T、激活參數(shù)49B,后者總參數(shù)284B、激活參數(shù)13B,兩者均支持一百萬token 上下文。

      如果單看百萬上下文的能力,在V4之前市場上已有多款模型能夠?qū)崿F(xiàn),國外如谷歌Gemini ,國內(nèi)如阿里Qwen、月之暗面Kimi等。

      DeepSeek-V4 令人驚艷的地方,是又一次帶來效率革命,在性能提升的同時實現(xiàn)成本下降,尤其是讓Agent更便宜成為可能。

      更重要的是,V4為打破算力束縛提供了更大可能性,大模型的算力底座從英偉達向華為邁出了堅實一步。

      1.轉(zhuǎn)向Agent

      DeepSeek官方表示,V4在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。

      其中,DeepSeek-V4-Pro性能比肩頂級閉源模型。

      在世界知識測評中,DeepSeek-V4-Pro大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。在推理性能上,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得了世界頂級閉源模型相當?shù)某煽儭?/p>

      不過,技術(shù)報告顯示,最大推理強度模式DeepSeek-V4-Pro-Max性能仍略遜于GPT-5.4和Gemini 3.1-Pro,這表明其發(fā)展軌跡大致落后于最先進的前沿模型約3到6個月。


      DeepSeek-V4-Pro-Max與同類模型的基準性能對比

      值得注意的是,DeepSeek-V4-Pro的Agent 能力大幅提高。

      在對DeepSeek-V4技術(shù)報告的深入分析中,「甲子光年」注意到,V4在更明顯地轉(zhuǎn)向Agent任務。從V3.1到V3.2,DeepSeek已經(jīng)在強化工具調(diào)用和Agent能力,到了V4,這條線更清楚。

      技術(shù)報告里出現(xiàn)了工具調(diào)用格式、推理內(nèi)容管理、Quick Instruction、Agent沙箱基礎(chǔ)設施,以及Search、White-Collar Task、Code Agent等真實任務評測。重點考察模型能不能在多步任務中低成本地調(diào)用工具、保留狀態(tài)、繼續(xù)執(zhí)行。

      在Agent 能力提高的同時,V4提供的價格相當實惠。緩存命中場景下,F(xiàn)lash版輸入成本低至0.2元/百萬Token。對于需要大量、多輪次Token交互的Agent應用來說,這無疑是降低成本的好消息。

      能力提高、價格下降,毫無疑問,V4在瞄準Agent 發(fā)力,也將進一步推動Agent 的普及。

      2.更便宜、更快

      DeepSeek-V4系列此次表現(xiàn)出的最大特點,是在長上下文場景中極高的效率。

      在1M上下文設置下,V4-Pro的單token推理FLOPs只有V3.2的27%,所需KV緩存空間也僅為其10%。

      而參數(shù)激活數(shù)量更少的DeepSeek-V4-Flash則進一步提升了效率:在百萬上下文中,其單token推理FLOPs僅為DeepSeek-V3.2的10%,KV緩存容量僅為7%。


      DeepSeek-V4系列與DeepSeek-V3.2的推理FLOPs計算量及KV緩存容量

      基于這種進步,DeepSeek官方宣布,“從現(xiàn)在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務的標配?!?/strong>

      這帶來了什么?最直觀的就是價格便宜。

      處理一個Token所需的總計算量驟降,直接導致在云端處理每一條請求的電力、硬件磨損和運營成本都斷崖式下降。這是DeepSeek敢于將API定價打到行業(yè)地板價。

      DeepSeek V4-Flash輸出價為2元/百萬token,不到同天發(fā)布的GPT-5.5 Pro輸出價(180美元)的千分之二。


      除了更便宜,模型也會更快。KV緩存占用降低,也有助于提升并發(fā)能力,并在一定程度上改善長上下文請求的響應效率。

      讓或許能讓許多曾經(jīng)“奢侈”的應用場景成為現(xiàn)實。例如,將整個代碼庫塞進上下文進行跨文件的“智能體編程”(Agentic Coding)、讓AI進行長時間的自主規(guī)劃與反思等。

      效率的提高源自工程層面的創(chuàng)新。

      「甲子光年」認為,在延續(xù)底層工程哲學的基礎(chǔ)上,V4的重點進一步轉(zhuǎn)向兩個問題:一是如何低成本支持百萬token上下文,二是如何讓更復雜的模型結(jié)構(gòu)和后訓練流程穩(wěn)定運行。

      最核心的結(jié)構(gòu)創(chuàng)新是混合注意力機制(HybridAttention),這讓V4的長上下文效率大幅提升。

      大模型在生成內(nèi)容時,需要不斷回看此前上下文。上下文越長,需要保存和調(diào)用的KV緩存就越多,每生成一個新Token時的推理開銷也會隨之增加。DeepSeek-V4的思路是,將長上下文分層處理,將壓縮稀疏注意力(CSA)與重度壓縮注意力(HCA)相結(jié)合。

      具體來說,V4將壓縮稀疏注意力(CSA)和重度壓縮注意力(HCA)結(jié)合:CSA先壓縮KV信息,再篩選與當前query最相關(guān)的部分參與計算;HCA則以更高壓縮率保留遠距離上下文的粗粒度信息。同時,滑動窗口注意力(SWA)處理近處上下文細節(jié),彌補壓縮機制可能導致的局部信息損失。

      通俗地說,傳統(tǒng)注意力機制更像把整本書逐頁攤開,每次答題都重新翻一遍;V4則更像更像是一個智能索引,把近處內(nèi)容保留原文,把遠處內(nèi)容壓縮成章節(jié)摘要。

      另一項核心架構(gòu)創(chuàng)新是流形約束超連接(mHC),用于增強底層穩(wěn)定性。混合注意力機制解決的是模型“怎么看長文本”,mHC解決的是模型內(nèi)部信息“如何穩(wěn)定傳遞”。

      技術(shù)報告中提到,通過重計算、融合算子等工程優(yōu)化,mHC帶來的額外訓練時間開銷被控制在約6.7%。這表明它并非單純的理論構(gòu)想,而是適配V4大規(guī)模生產(chǎn)訓練的實用設計。

      DeepSeek對V4的架構(gòu)很有信心,表示其性能可與GPT-5.2和Gemini-3.0-Pro相媲美,確立了其作為處理復雜推理任務的高性價比架構(gòu)的地位。


      DeepSeek-V4系列的整體架構(gòu)

      3.加速國產(chǎn)替代

      另一個值得注意的地方是,此次DeepSeek-V4與華為的關(guān)聯(lián)更強。

      技術(shù)報告中提到一個細節(jié):DeepSeek的細粒度專家并行優(yōu)化方案已經(jīng)在英偉達GPU和華為昇騰NPU上驗證。

      并且,這套方案在通用推理負載中帶來1.50—1.73倍加速,在強化學習采樣和高速智能體服務等低延遲場景中最高達到1.96倍加速。

      這并不等于V4全棧已經(jīng)完全適配昇騰,但意味著昇騰950超節(jié)點對V4-Pro的意義不只是增加算力,也在于提升多卡協(xié)同能力。若后續(xù)供給和適配順利,V4-Pro的吞吐和成本空間有望改善。

      DeepSeek在V4發(fā)布的官宣文章中,用一行小字寫道:預計下半年昇騰950超節(jié)點批量上市后,pro的價格會大幅下調(diào)。

      另一方面,技術(shù)報告還提到,DeepSeek-V4系列的路由專家參數(shù)均采用FP4精度。雖然在現(xiàn)有硬件上,F(xiàn)P4×FP8運算的峰值FLOPs性能與FP8 × FP8運算相同,但從理論上講,在未來硬件上其效率可提高三分之一,這將進一步提升DeepSeek-V4系列的運算效率。

      據(jù)「甲子光年」觀察,從V3開始,DeepSeek就沒有單純依賴參數(shù)規(guī)模,而是持續(xù)優(yōu)化訓練效率、顯存占用和硬件利用率。在訓練工程上,V4引入Muon優(yōu)化器,并進一步使用FP4/FP8低精度訓練。前者用于提升收斂速度和訓練穩(wěn)定性,后者用于降低顯存、帶寬和推理成本。

      這可謂DeepSeek-V4 在技術(shù)選型上的一個“伏筆”:它在當前硬件上選擇了成熟的 FP8×FP8 路線,但架構(gòu)設計已為未來的 FP4×FP8 混合精度運算做好了準備,一旦硬件成熟,效率將立刻躍升。

      這意味著 V4 未來有望在單卡上運行更大模型,推理成本也有望繼續(xù)下降。

      同時,基于DeepSeek的高效架構(gòu),即使國產(chǎn)AI芯片單卡算力絕對值不如英偉達等頂級產(chǎn)品,也能憑借其高吞吐、低顯存占用的優(yōu)勢運行大模型。

      這無疑進一步打破了算力束縛,國產(chǎn)替代的步伐加快了。

      (封面圖由AI生成,文中配圖來自:DeepSeek)



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      40歲上市公司女副總郭智超離世,是資深摩友,死因是意外交通事故

      40歲上市公司女副總郭智超離世,是資深摩友,死因是意外交通事故

      娛樂圈圈圓
      2026-06-22 10:09:03
      洪秀柱直言敲打:既然不愿扛起統(tǒng)一大旗,何必身居國民黨主席之位

      洪秀柱直言敲打:既然不愿扛起統(tǒng)一大旗,何必身居國民黨主席之位

      誰將主宰未來
      2026-06-21 09:57:43
      中山市小欖鎮(zhèn)九洲基社區(qū)黨委原書記盧常秋被開除黨籍

      中山市小欖鎮(zhèn)九洲基社區(qū)黨委原書記盧常秋被開除黨籍

      南方都市報
      2026-06-22 11:13:11
      周星馳導演新電影《功夫女足》官宣7月上映

      周星馳導演新電影《功夫女足》官宣7月上映

      IT之家
      2026-06-22 10:33:27
      “切斷和中國的關(guān)系,日本沒有未來”

      “切斷和中國的關(guān)系,日本沒有未來”

      環(huán)球時報國際
      2026-06-22 09:57:36
      世界杯官方發(fā)土味喜報祝賀中國裁判,網(wǎng)友:官方太會整活了

      世界杯官方發(fā)土味喜報祝賀中國裁判,網(wǎng)友:官方太會整活了

      大象新聞
      2026-06-21 22:25:38
      翁虹女兒被UCLA錄取,翁虹發(fā)長文:萬萬沒想到真切發(fā)生在我家

      翁虹女兒被UCLA錄取,翁虹發(fā)長文:萬萬沒想到真切發(fā)生在我家

      仙味少女心
      2026-06-21 18:31:19
      中共中央批準,開除尹建業(yè)黨籍

      中共中央批準,開除尹建業(yè)黨籍

      新京報
      2026-06-22 11:38:16
      小天賜爸爸父親節(jié)崩潰:再也瞞不住了,我對不起走了6年的兒子

      小天賜爸爸父親節(jié)崩潰:再也瞞不住了,我對不起走了6年的兒子

      絢麗的畫卷
      2026-06-21 22:59:28
      狂省一大筆!雷霆原本奢侈稅2.13億,送走威金斯后省了6100萬

      狂省一大筆!雷霆原本奢侈稅2.13億,送走威金斯后省了6100萬

      懂球帝
      2026-06-22 10:55:25
      在柬埔寨遞槍劫囚,“江湖最后大嫂”阮氏海云獲刑8年,主謀丈夫重判14年;此前劫囚事件被解讀為“為愛奮不顧身”

      在柬埔寨遞槍劫囚,“江湖最后大嫂”阮氏海云獲刑8年,主謀丈夫重判14年;此前劫囚事件被解讀為“為愛奮不顧身”

      揚子晚報
      2026-06-22 12:11:06
      央媒罕見連發(fā)三問!4400萬輛電車免費用路,公平的天平何時能平?

      央媒罕見連發(fā)三問!4400萬輛電車免費用路,公平的天平何時能平?

      呼呼歷史論
      2026-06-21 01:13:13
      亞馬爾進球后再做“304”手勢,上屆世界杯還在教室看球的他,超越梅西的一項數(shù)據(jù)

      亞馬爾進球后再做“304”手勢,上屆世界杯還在教室看球的他,超越梅西的一項數(shù)據(jù)

      紅星新聞
      2026-06-22 07:59:34
      漲粉1400多萬卻接“失業(yè)通知書”,佛得角門將收不續(xù)約通知,奶奶曾變賣首飾養(yǎng)大他

      漲粉1400多萬卻接“失業(yè)通知書”,佛得角門將收不續(xù)約通知,奶奶曾變賣首飾養(yǎng)大他

      紅星新聞
      2026-06-21 23:13:52
      上海相親角39歲優(yōu)質(zhì)女站一上午無人問,大叔幾句實話懟到沉默

      上海相親角39歲優(yōu)質(zhì)女站一上午無人問,大叔幾句實話懟到沉默

      風起見你
      2026-06-22 01:00:33
      18歲斬世界杯首球!西班牙2億天才連創(chuàng)5大紀錄 超越梅西+比肩貝利

      18歲斬世界杯首球!西班牙2億天才連創(chuàng)5大紀錄 超越梅西+比肩貝利

      我愛英超
      2026-06-22 00:52:15
      離婚三年,前夫每月來我家睡一晚,昨晚他照例來,這回我沒讓他碰

      離婚三年,前夫每月來我家睡一晚,昨晚他照例來,這回我沒讓他碰

      千秋文化
      2026-06-21 19:55:40
      女子稱寵物犬寄存海底撈辦公室后死亡:員工承諾開空調(diào)卻關(guān)了!門店回應→

      女子稱寵物犬寄存海底撈辦公室后死亡:員工承諾開空調(diào)卻關(guān)了!門店回應→

      極目新聞
      2026-06-22 08:36:39
      北京市發(fā)布雷電黃色預警

      北京市發(fā)布雷電黃色預警

      界面新聞
      2026-06-22 11:06:11
      兒子給哈佛捐20多億,母親給麻省捐11億,家族在中國年收租百億?

      兒子給哈佛捐20多億,母親給麻省捐11億,家族在中國年收租百億?

      離離言幾許
      2026-06-21 22:51:14
      2026-06-22 13:04:49
      甲子光年
      甲子光年
      中國科技產(chǎn)業(yè)化前沿智庫
      3485文章數(shù) 9274關(guān)注度
      往期回顧 全部

      科技要聞

      智譜盤中狂飆超40%,市值破萬億港元

      頭條要聞

      37歲男子愛上女主播月賺5千打賞14萬 父親:智商有問題

      頭條要聞

      37歲男子愛上女主播月賺5千打賞14萬 父親:智商有問題

      體育要聞

      法國球星祝中國隊下屆世界杯取得好成績

      娛樂要聞

      韓紅幫馮小剛宣傳,結(jié)果翻車了…

      財經(jīng)要聞

      “床墊界的特斯拉”破產(chǎn)了

      汽車要聞

      全面提升 全新理想L8 livis將家用舒適再進化

      態(tài)度原創(chuàng)

      數(shù)碼
      健康
      房產(chǎn)
      本地
      公開課

      數(shù)碼要聞

      紅魔游戲平板5 Pro外觀正式公布:行業(yè)唯一RGB水冷設計 透明機身超酷炫

      吃粽子的3條保胃法則,消化科醫(yī)生推薦

      房產(chǎn)要聞

      商業(yè)清零式退潮,大量住宅登場!三亞又要大規(guī)模調(diào)規(guī)!

      本地新聞

      龍騰資江 韻動邵陽

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 2021自拍偷在线精品自拍偷| 一区二区三区人妻无码| 66AV免费视频在线观看| 农村欧美丰满熟妇xxxx| 国产精品中文第一字幕| 久久天堂无码av网站| 无码aⅴ免费中文字幕久久| 亚洲高清 一区二区三区| 色吊丝永久免费| 中文字幕人妻无码专区APP| 亚洲精品一区二区动漫| 国产亚洲合集| 精品无码人妻一区二区三区三州| 日本免费无遮挡吸乳视频中文字幕| 日韩人妻无码精品久久久不卡| 四虎国产精品永久在线下载| 丹东市| 韩日午夜在线资源一区二区| 97成人精品视频在线观看| 麻豆91精品在线观看| 亚洲中文字幕精品无人区| 99久久国产自偷自偷免费一区| 日韩制服丝袜无码A片| 国产欧美亚洲精品第一页在线| 亚洲AV无码成H人动漫无遮挡| 日韩幕无线码一区中文| 草草影院发布页| 国产精品va免费视频| 中文字幕亚洲天堂| 黄色三级亚洲男人的天堂| 亚洲日韩?国产丝袜?在线精品| 亚洲无专区专ma区免费收看| 三级在线网站| 宅男噜噜噜66在线观看| 色色资源网| 美女张开腿黄网站免费 | 在线观看免费网页欧美成| 影音先锋自拍| 国产精品无码久久久久久久久久| 国产一区二区在线视频观看| 黑森林福利视频导航|