<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      中國AI性價比奇高的秘密,被一篇博客捅破了

      0
      分享至



      五一假期后的第一個交易日,智譜和MiniMax都漲瘋了。

      5月4日,智譜漲超10%,股價再次逼近千元關口,MiniMax大漲12.62%,報收803港元。

      根據摩根士丹利的報告,股價暴漲的原因來自于中國AI獨有的“性價比敘事”。

      摩根士丹利在報告《China‘s AI Path: More Bang For The Buck》中表示,在算力受到約束的前提下,中美頂尖模型的智能水平正在快速接近,差距已經收窄到3到6個月。

      同時報告指出,中國模型真正突出的地方,是能以美國同行15%到20%的推理成本,實現接近同等水平的智能。

      這句話其實很好理解。大家不一定需要用最強的模型,但絕大多數人都想用便宜的模型。

      市場買的不是一個簡單的“國產替代”故事,而是中國AI正在把性價比轉化成真實調用量、真實收入和真實估值彈性。

      但問題也隨之而來,這種性價比到底從哪里來?

      如果只是低價獲客,那它很快會變成價格戰。

      如果只是模型蒸餾,可現在Anthropic、OpenAI等企業,均已關閉蒸餾的入口,那么評級不應該下降嗎,怎么還調高了?

      事實上,真正讓這個敘事變得更有說服力的,是智譜在五一前發布的技術博客《Scaling Pain:超大規模Coding Agent推理實踐》。

      這篇博客沒有講宏大的AGI愿景,而是把KV Cache、吞吐、調度、異常輸出這些底層工程攤開給市場看。

      最主要的是,它把中國AI性價比背后的秘密,給“捅破了”。

      A

      在這篇博客里,智譜大概講了怎么通過優化緩存、調度和異常監控,讓同樣的GPU能干更多活,出錯更少。

      智譜發現,AI不好用不一定是模型不聰明,也可能是后臺運行系統太亂。它修掉了緩存串數據的問題,優化了GPU調度和緩存復用,還加了一個能提前發現異常輸出的報警器。

      結果就是,同樣的模型、同樣的GPU,可以服務更多用戶,出錯概率也更低。所以它的“性價比敘事”不是單純降價,而是靠工程優化,把每張GPU榨出了更多穩定可用的算力。

      經過底層工程優化,GLM-5系列在Coding Agent場景下的系統吞吐量最高提升132%,系統異常輸出率從大約萬分之10,下降到了萬分之3。

      比如原來一張GPU,它原先一小時能服務100個任務,現在經過優化后,最高可能服務232個任務。

      每一項單獨看,都不足以決定勝負。但疊在一起,就是同等算力下多出來的一倍吞吐,和一個數量級以上的穩定性提升。

      模型沒有變。變的是模型被“用起來”的方式。

      具體來講,自3月起,智譜在GLM-5的線上監控和用戶反饋中觀察到三類異常現象:亂碼、復讀、生僻字。這些現象在表面上與長上下文場景下常見的“降智”相似。

      但智譜團隊沒有上線任何降低模型精度的優化。那異常究竟源于模型本身,還是源于推理鏈路?

      在反復分析推理日志后,他們找到了一個意想不到的切入點:投機采樣指標可以作為異常檢測的參考信號。

      投機采樣原本只是一個性能優化技術。先由草稿模型生成候選token,再由目標模型校驗并決定是否接受,從而在不改變最終輸出分布的前提下提升解碼效率。

      就是讓小模型先快速生成一批答案,大模型再挑選正確的,這樣既快又準。

      智譜團隊發現,當異常發生時,投機采樣的兩個指標會呈現穩定模式。于是他們把投機采樣從單純的性能優化,擴展為輸出質量的實時監控信號。

      當spec_accept_length持續低于1.4且生成長度已超過128 token,或spec_accept_rate超過0.96時,系統主動中止當前生成,把請求交給負載均衡器重試。

      這兩個數字就像體檢指標,一旦異常就說明模型“生病了”,需要重啟治療。

      用戶雖然感知不到這個過程,但是后臺的確是完成了一次這樣的重啟。

      異常的根因,是KV Cache復用沖突。

      這就好比廚房,到了飯點的高峰期,很多人同時過來點單。

      系統要臨時保存每個用戶的上下文,也就是KV Cache。這桌客人剛才點了什么、是要少放辣椒還是不吃香菜。一個兩個客人還好,一旦客人多了,服務員就容易記錯。



      高并發時,某些緩存被回收、復用、讀取的順序亂了。結果模型拿錯了上下文,就可能輸出亂碼、復讀、生僻字。

      在推理引擎中,PD分離架構下,請求生命周期與KV Cache回收與復用的時序之間存在不一致。并發壓力一大,沖突就被放大,表現在用戶端就是亂碼和復讀。

      于是多個請求同時搶一塊內存,結果數據亂了套,用戶看到的就是亂碼。

      智譜團隊定位了這個bug,也修復了它。

      此外,他們還在主流開源推理框架SGLang的源代碼層面發現并修復了HiCache模塊的加載時序缺失問題,也就是read-before-ready。

      修復方案通過Pull Request #22811提交給了SGLang社區,并被采納。

      SGLang是一個開源項目,全稱可以理解為一種面向大語言模型的推理/服務框架。它不是一個大模型,也不是一家AI公司,而是一套讓大模型高效運行的基礎軟件。

      智譜在使用SGLang這套開源推理框架時,發現了一個高并發緩存bug。

      它沒有只在自己內部修,智譜還把修復代碼提交給SGLang這個開源項目。

      項目維護者審核后接受并合并。于是,這個修復進入了公共版本,其他使用SGLang的開發者和公司之后也可以用到。

      這什么意思呢?

      如果千問的某個部署鏈路用了SGLang+HiCache,那么阿里也會因為智譜發現并修復了這個問題而受益。

      還是剛才說的那句話,模型是沒有變的,但通過工程優化,讓它在用起來的時候更聰明了。

      B

      智譜這篇博客真正戳破的,是一個更深的層次。

      Chatbot時代的便宜,很大程度上來自訓練成本低,一部分訓練集來自對頭部模型的蒸餾。

      Agent時代,這招行不通了。

      今年以來,Anthropic和OpenAI陸續關閉了蒸餾入口,明確禁止用其模型輸出訓練競爭模型。靠蒸餾取巧的路,越來越窄。

      但中國AI公司的性價比敘事并沒有弱下去,市場反而在為這個故事加碼。

      原因在于,性價比的定義已經變了。

      Chatbot時代,平均上下文55K tokens,單次對話,低并發。

      Agent時代,平均上下文70K+ tokens,長時間任務(8小時級),高并發、高前綴復用。

      Chatbot時代,AI性價比的計量單位很簡單。同樣問一個問題,誰的模型更便宜,誰的回答更接近一線水平。

      行業討論的是每百萬token多少錢、模型參數多大、榜單成績高不高。

      Agent時代,沒人問這個,這套算法失效了。

      用戶買的不再是一句回答。他買的是一個完整任務的完成結果。

      一個Coding Agent要讀代碼、理解上下文、規劃步驟、調用工具、修改文件、跑測試、失敗重試。它消耗的token不是一次問答的增量,而是一個工作流的總賬。

      OpenRouter作為全球最大的調用平臺,它每周處理的token總量,從2026年1月第一周的6.4萬億,漲到2月9日當周的13萬億,一個月翻了一倍。

      OpenRouter官方的說法是,100K到1M長文本區間的增量調用需求,正是agent工作流的典型消耗場景。

      大家使用AI的模式,已經從“對話型”切換到了“流程型”。因此,AI性價比的單位,也從“token單價”變成了“任務單價”。

      這就導致,有些模型它的token便宜,但是由于模型性能不行,進行任務的過程中總是失敗,或者任務結果不達標,導致它的agent價格并不便宜。

      比如說,一個8小時級別的Coding任務,中途只要亂碼一次,整個工作流可能都要重來。節省下來的token單價,補不回浪費的時間。

      中國AI的性價比敘事正在升級。

      以前講的是“輸出相同水準的答案,我更便宜”。現在講的是“同樣復雜的任務,我能用更低成本跑完”。

      開源基礎設施也在成為中國AI的新護城河。

      前文提到的SGLang就是如此。中國AI的工程能力,開始向上游社區輻射。

      這件事的價值不只在于智譜修了一個bug,而在于中國AI公司正在把真實業務里的高并發、長上下文、agent調用問題,反向沉淀成公共基礎設施的能力。

      就像前文提到的,當一個修復進入SGLang這樣的開源框架,它就不再只服務于智譜自己的模型。所有使用這套框架部署大模型的團隊,都有機會獲得更穩定的緩存、更低的推理成本和更好的agent體驗。

      模型能力可以被追趕,價格可以被壓低,但基礎設施一旦進入開源生態,就會變成標準、接口和開發習慣。

      誰更早把自己的工程經驗寫進這些底層系統,誰就更容易在下一輪AI應用爆發里占住位置。

      C

      回到資本市場。

      AI大模型概念股全線走高,資本愿意給AI公司重新定價?市場買的到底是什么?

      答案是,資本市場正在為“中國AI公司能用更低推理成本做出接近一線智能”的敘事買單。

      還是以OpenRouter的數據來說。

      中國頭部AI公司的token消耗份額,從2025年4月的5%快速攀升至2026年3月的32%。美國頭部模型份額,從58%大幅下滑至19%。

      MiniMax、智譜、阿里的token使用量,在2026年2-3月較去年12月增長4-6倍。

      除了token調用以外,中國AI還在形成一套,完全不同于海外巨頭的增長邏輯。

      海外頭部模型在賣“能力溢價”。

      模型能力越強,單次調用越貴,用戶為最強智能付費。Claude、GPT-5、Gemini都在往這個方向走。

      中國AI在賣“工程”。

      模型能力逼近一線模型,但是價格、延遲、調用門檻更低,更符合絕大多數高頻場景的需求。

      摩根士丹利的報告里提到,中國模型的輸入價格約為0.3美元/百萬token,部分海外同類產品的價格在5美元左右。這中間是十幾倍的差距。

      當AI從嘗鮮工具變成生產力工具,性價比會直接決定調用頻次。

      模型便宜一點,企業就敢把更多客服、代碼、營銷、數據分析任務交給它。任務跑得越多,token消耗越大,平臺越能攤薄基礎設施成本。



      我認為在這個環節,它是有可能會形成一個飛輪的。

      第一圈,是用更低的API價格和更接近一線的能力,去吸引開發者和企業。

      第二圈,更高的調用量會帶來更多真實場景,倒逼模型和推理系統繼續優化。

      第三圈,也就是智譜這篇技術博客里講到的,用工程優化降低單位token和單位任務成本,讓廠商有能力繼續降價、漲量,或者在高價值場景里漲價。

      第四圈,當token消耗成為AI時代的新流量,誰能以更低成本承載更多token,誰就更接近下一階段的平臺型公司。

      如果只是模型降價,市場會擔心這是補貼和價格戰,越來越燒錢,總有人的錢包撐不住。

      而且,價格戰撐不起高估值。

      但如果降價背后是吞吐提升、緩存復用、異常率下降和調度效率提升,那么低價就不是犧牲利潤換增長,而是工程能力釋放出來的成本空間。

      價格戰和這種工程優化的結果,雖然都是讓模型更便宜,而且在財報上看起來可能差不多。在估值模型里,差得很遠。

      前者是補貼,市場會折價。后者是工程壁壘,市場會溢價。

      最后可以落到一個判斷。

      過去AI公司的估值看模型能力上限,看誰更接近AGI。當時市場在為“最強智能”付費,最強智能的定義越來越模糊,單次調用越來越貴。

      現在agent時代,估值還要看成本下限。看誰能把智能穩定、便宜、大規模地交付出去。

      對于追求最尖端的“智能”,這可能不是中國AI擅長的事情。

      然而中國AI是最有可能把“智能”這兩個字,做成所有人和企業都用得起的基礎設施。

      而市場只愿意為能說清楚自己邏輯的公司付錢。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      夏補鉀,不疲憊,建議大家:夏天多吃這3種“補鉀高手”,精神好

      夏補鉀,不疲憊,建議大家:夏天多吃這3種“補鉀高手”,精神好

      阿龍美食記
      2026-05-31 20:23:07
      每體:卡薩多接近加盟摩納哥,巴薩要價2000萬

      每體:卡薩多接近加盟摩納哥,巴薩要價2000萬

      懂球帝
      2026-06-04 00:07:25
      馬上官宣!皇馬新帥來了!穆帥重返伯納烏

      馬上官宣!皇馬新帥來了!穆帥重返伯納烏

      烏龍球OwnGoal
      2026-06-03 09:37:24
      法國特種兵突襲11萬噸俄羅斯油輪,不到24小時,普京政府準時斷供

      法國特種兵突襲11萬噸俄羅斯油輪,不到24小時,普京政府準時斷供

      小小科普員
      2026-06-03 14:54:50
      剛剛,消費死多頭認輸,一年四倍基火了!女民警炒股虧7000萬,出事了

      剛剛,消費死多頭認輸,一年四倍基火了!女民警炒股虧7000萬,出事了

      金石隨筆
      2026-06-04 00:50:25
      沉默45年,中國終于迎來第二輪“嚴打”!目標改變總體戰正式打響

      沉默45年,中國終于迎來第二輪“嚴打”!目標改變總體戰正式打響

      聞識
      2026-05-04 08:59:03
      多次侵入某戰區醫院數據庫,竊取藥品數據后對外銷售,獲利45.8萬元!楊某被判3年6個月

      多次侵入某戰區醫院數據庫,竊取藥品數據后對外銷售,獲利45.8萬元!楊某被判3年6個月

      都市快報橙柿互動
      2026-06-03 22:25:44
      白嫖潮汕火鍋失控!多位被坑商家再實錘,警方出手,坐牢只是開始

      白嫖潮汕火鍋失控!多位被坑商家再實錘,警方出手,坐牢只是開始

      奇思妙想草葉君
      2026-06-03 17:07:22
      iPhone17最新618價格確定,256GB下跌700元,降價后值得買嗎?

      iPhone17最新618價格確定,256GB下跌700元,降價后值得買嗎?

      科技阿維
      2026-06-03 21:35:14
      前央視主持林海,因摔耳機丟了鐵飯碗,54歲現身街頭當吃播

      前央視主持林海,因摔耳機丟了鐵飯碗,54歲現身街頭當吃播

      林輕吟
      2026-06-01 07:14:42
      曾諷董路是馬戲團 孫繼海社媒被沖:人家奪冠 你們連校隊都踢不過

      曾諷董路是馬戲團 孫繼海社媒被沖:人家奪冠 你們連校隊都踢不過

      風過鄉
      2026-06-03 06:58:06
      庫里兄弟歐洲度假,一個賺5億,一個賺0.5億,老婆都很漂亮

      庫里兄弟歐洲度假,一個賺5億,一個賺0.5億,老婆都很漂亮

      大西體育
      2026-06-03 11:01:56
      屋漏偏逢連夜雨!60歲郭富城再迎噩耗,方媛疑產后抑郁是冰山一角

      屋漏偏逢連夜雨!60歲郭富城再迎噩耗,方媛疑產后抑郁是冰山一角

      悄悄史話
      2026-05-28 11:44:23
      女大學生宿舍試穿抹胸裙走紅,曼妙身材圈粉無數,露臉后卻遭惡評

      女大學生宿舍試穿抹胸裙走紅,曼妙身材圈粉無數,露臉后卻遭惡評

      搗蛋窩
      2026-05-21 06:40:07
      被追債36億,萬達沒了,首富沒了,王健林還剩什么?

      被追債36億,萬達沒了,首富沒了,王健林還剩什么?

      李云飛Afey
      2026-06-02 16:32:32
      學醫后才明白,穩定血糖最好的運動,不是快走慢跑,而是這個

      學醫后才明白,穩定血糖最好的運動,不是快走慢跑,而是這個

      健康科普365
      2026-06-02 19:45:05
      35頁PPT瘋傳:洛陽女子1女談3男,每天卡時間,都已談婚論嫁

      35頁PPT瘋傳:洛陽女子1女談3男,每天卡時間,都已談婚論嫁

      烈史
      2026-05-30 13:23:41
      盲訂破5萬臺!奇瑞王炸出擊,續航2000km+5米車長,售價太香了

      盲訂破5萬臺!奇瑞王炸出擊,續航2000km+5米車長,售價太香了

      沙雕小琳琳
      2026-06-03 16:37:26
      當不成總統了?特朗普體檢報告出來了,快80歲的他,或被迫下臺

      當不成總統了?特朗普體檢報告出來了,快80歲的他,或被迫下臺

      杰絲聊古今
      2026-06-04 01:08:50
      6月3日人民幣對美元中間價調升3個基點

      6月3日人民幣對美元中間價調升3個基點

      證券時報
      2026-06-03 09:43:05
      2026-06-04 06:15:00
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2512文章數 8064關注度
      往期回顧 全部

      科技要聞

      傳DeepSeek融資意向500億:騰訊投100億

      頭條要聞

      男子不想上班辭職后上武當山當道士 8個月后選擇下山

      頭條要聞

      男子不想上班辭職后上武當山當道士 8個月后選擇下山

      體育要聞

      選擇中國品牌的庫里,和他們的巨大野心

      娛樂要聞

      官方痛批亂象 劉濤鄭愷等藝人遭點名

      財經要聞

      AI,開始偷懶了?

      汽車要聞

      專訪蔣平:安全不做高低配 長安要讓安全技術普惠

      態度原創

      本地
      旅游
      教育
      時尚
      公開課

      本地新聞

      用楊柳青年畫的方式,打開天津

      旅游要聞

      昆明郊野公園“無盡夏”繡球花展迎來盛花期

      教育要聞

      問答環節(留學建議與中外金融史)

      月經、初潮與生育真相,那些藏在動畫片里的性啟蒙

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 又黄又爽又刺激又色的视频| 日韩精品国产二区三区| 中文无码色综合久久久| 啪啪啪免费网站| 久久天天躁夜夜躁狠狠85| 欧美偷拍综合| 久久亚洲国产的中文| 野花香视频在线观看免费高清版| 亚洲欧美激情综合第1页| 亚洲精品人妻系列| 国产自国产在线无毒不卡| 国产一区| 亚洲最大有声小说AV网| 免费看欧美日韩一区二区三区| 蜜桃麻豆www久久囤产精品| 国产乱码精品一区二区三| 无码AV中文字幕久久专区| 国产无套精品一区性色| 亚洲V天堂V手机在线| 亚洲制服丝袜无码| 精品自拍视频| 91福利视频一区二区| 国内自拍偷拍亚洲天堂| 亚洲精品456在线| 亚洲精品国产AV天美传媒| 亚洲色成人www永久在线观看| 麻豆天美东精91厂制片| 国产成人精品999在线观看| 亚洲国产午夜精品福利| 无码人妻一区二区三区…| 汉川市| 一本色道久久88亚洲综合| 在线人成视频播放午夜福利| 久久久一本精品99久久精品88| 日韩A| 草草影院国产第一页| 精品无码国产日韩制服丝袜| 男人扒开添女人下部免费视频 | 日韩中文字幕免费在线观看| 国产麻豆一区二区精彩视频| 精品久久欧美熟妇www|