網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

中文AI對話更燒錢？這“稅”背后藏著什么秘密！

2026-05-04 15:55:27　來源: 中科智媒

上海舉報

分享至

本報訊最近，AI大模型用戶發(fā)現(xiàn)了一個有趣的現(xiàn)象：用中文與AI對話，成本似乎比英文更高。這種現(xiàn)象被戲稱為"中文稅"。究竟是怎么回事？

一"稅"驚人：中文真的更貴

據(jù)最新數(shù)據(jù)顯示，在Claude和GPT等主流大模型中，中文的token消耗量普遍高于英文。某些場景下，中文版本的token數(shù)量比英文版多出64%，這意味著用戶需要支付更多的費用才能完成同樣的任務。

但有意思的是，國產(chǎn)大模型的情況恰好相反。在Qwen和DeepSeek等模型中，中文反而比英文更省錢，token消耗量僅為英文的65%左右。

價格差異從何而來

這背后的原因在于大模型的"Tokenizer"（分詞器）技術(shù)。簡單來說，AI模型無法直接理解文字，需要通過分詞器將文字切割成標準化的小塊（token）來處理。每個token都是一筆費用。

英文分詞相對直觀，一個單詞通常算一個token。但中文面臨不同的處理邏輯：一些國際主流模型采用BPE算法，根據(jù)訓練語料頻率合并字符，而早期訓練數(shù)據(jù)以英文為主，導致中文字符被過度拆解；相比之下，國產(chǎn)模型從一開始就將常用漢字和詞組納入整詞編碼，效率更高。

古文更省？別高興太早

還有一個有趣的現(xiàn)象：文言文比現(xiàn)代漢語更省token。但記者發(fā)現(xiàn)，這其實是把"編碼成本"的節(jié)約轉(zhuǎn)嫁給了"推理成本"——字少了，但AI需要消耗更多算力來理解。

歷史巧合：部首的秘密

更深層的研究發(fā)現(xiàn)，早期模型將漢字拆成多個token時，模型反而能通過UTF-8編碼的字節(jié)序列學到漢字部首信息，提升語義理解能力。而當新一代模型將漢字編碼為整字token后，雖然成本降低了，卻也失去了這條意外的語義通道。

歷史回響：林語堂與中文打字機

這個現(xiàn)象在歷史上早有先例。1947年，著名作家林語堂發(fā)明"明快打字機"，試圖將漢字高效嵌入西方打字機體系。他將漢字按部首拆解，用組合鍵定位字根，每分鐘可打40至50字。這種設計雖然商業(yè)上失敗了，卻為現(xiàn)代中文輸入法奠定了基礎。

正如歷史學家所言："中文始終面對一個問題——如何接入一套為西方語言設計的基礎設施。"從打字機到大模型，中文與技術(shù)的融合之路，始終充滿了意想不到的巧合與代價。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

媒體：繼稻城亞丁后湖北神農(nóng)架也被指“圈路收費”，游客被迫多繞百公里

澎湃新聞 2026-06-03 17:13:12
26009 跟貼 26009
湖南一老人正走路遭男子揮掌擊打，男子走開十多米突然折返將老人打倒

大風新聞 2026-06-04 05:06:25
134 跟貼 134

2026年全國高考報名人數(shù)為1290萬人

央視新聞客戶端 2026-06-03 14:02:58
20849 跟貼 20849

業(yè)主多次投訴小區(qū)違建別墅結(jié)果房屋越建越高各方回應

貴州日報 2026-06-03 19:33:06
1064 跟貼 1064
新賽季國際賽場首秀，中國女排0比3不敵捷克女排

澎湃新聞 2026-06-03 21:16:36
382 跟貼 382

“讓人無語！”小區(qū)電瓶車掃碼充電要過五關(guān)，關(guān)關(guān)都有廣告，一不小心就被引導去充值

都市快報橙柿互動 2026-06-03 16:48:38
1311 跟貼 1311

全球首個！荔枝×龍眼雜交新品種“懷石”來了：是荔枝，卻有龍眼味

大象新聞 2026-06-03 18:04:43
162 跟貼 162
糾結(jié)的歐洲人：邊說"不能關(guān)起大門" 邊說"不能怕中國"

澎湃新聞 2026-06-04 07:21:10
78 跟貼 78

成龍向全球發(fā)出入境游邀約：歡迎感受無濾鏡的真實中國

新京報 2026-06-01 12:09:13
686 跟貼 686
七戰(zhàn)全勝中國民間少年隊橫掃歐洲豪門

新快報新聞 2026-06-04 08:03:02
146 跟貼 146
印度極限高溫，“每天熱死3000人”

半島官網(wǎng) 2026-06-04 09:31:14
238 跟貼 238
年度最強打工人！杭州38歲會計師跳槽甲方公司，支付379萬元5.5折認購30萬股，不到半年暴漲至6200萬元

都市快報橙柿互動 2026-06-03 17:53:25
76 跟貼 76
初步結(jié)果顯示韓國執(zhí)政黨鎖定地方選舉勝局

國際在線 2026-06-04 06:26:12
79 跟貼 79
沈陽王厚元餃子店員拿吃飯的碗給顧客彈煙灰，“墻上掛著禁止吸煙”，品牌方回應：將處理

大風新聞 2026-06-04 11:15:10
0 跟貼 0
家里來了一窩“憤怒的小鳥” 表情嚴肅眼睛瞪得像銅鈴網(wǎng)友：這4只看著都很不好惹

荔枝新聞 2026-06-04 10:17:58
4 跟貼 4
全國健身錦標賽冠軍！湖北商貿(mào)學院老師實現(xiàn)賽事大滿貫

極目新聞 2026-06-04 09:58:44
1 跟貼 1
秦晉之好再添文旅新舉壺口瀑布6月一票通兩省

大象新聞 2026-06-04 10:47:05
31 跟貼 31
樓市“新”觀察 | 新政發(fā)力二手房市場迎超長“小陽春” 量價齊升成交提速

北青網(wǎng)-北京青年報 2026-06-04 11:38:06
2 跟貼 2
一輛新能源車已經(jīng)增重到3噸，何時是個頭？

都市快報橙柿互動 2026-06-04 08:26:28
0 跟貼 0
《三農(nóng)第一線》深入山東主產(chǎn)區(qū)夏收一線

農(nóng)視網(wǎng) 2026-06-04 13:02:26
1 跟貼 1
“今天買到明天生產(chǎn)的面包”！一面包店被投訴超前標注，商家稱

新浪財經(jīng) 2026-06-04 12:54:16
0 跟貼 0
最新 | 網(wǎng)紅“小孬”意外離世！動物園通報！

天津廣播 2026-06-04 12:54:17
0 跟貼 0
廣西防城港一“網(wǎng)紅”菠蘿蜜未成熟就被摘走！生長記錄者直呼可惜

大風新聞 2026-06-04 12:38:25
0 跟貼 0
31條中日航線5月取消全部航班

財聯(lián)社 2026-06-03 15:56:05
0 跟貼 0
張雪機車門店教唆用戶偷騎無牌無保險車輛，并稱交警追不上，張雪本人怒斥讓其關(guān)店

金融界 2026-06-04 12:52:41
0 跟貼 0
8個“6”手機號碼拍出20萬高價：起拍價3.67萬，附帶套餐僅49元

紅星資本局 2026-06-04 12:06:33
0 跟貼 0
挪威深海發(fā)現(xiàn)載有中國瓷器的18世紀沉船：大量青花瓷碗重見天日，文物達數(shù)千件，目前正開展船只溯源工作并努力還原歷史真相

大風新聞 2026-06-02 12:15:18
0 跟貼 0

汽車要聞

手機 / 數(shù)碼

房產(chǎn) / 家居

中文AI對話更燒錢？這“稅”背后藏著什么秘密！

歷史最大IPO！馬斯克下周沖擊萬億富豪

男子帶20萬練功券約見女主播 發(fā)生關(guān)系后騙走對方1萬

男子帶20萬練功券約見女主播 發(fā)生關(guān)系后騙走對方1萬

王俊杰11前板成第一尖刀 媒體人：獨一檔

奚夢瑤頭紗上的古董發(fā)卡也是四太的

SpaceX發(fā)行價135美元 6月12日上市交易

北京現(xiàn)代5月銷量強勢反彈:國內(nèi)17065輛 出口環(huán)比翻倍

態(tài)度原創(chuàng)

?閃閃小葵花，成長正當時? 「尋找閃亮小主角」闖關(guān)合集上線！小手勇闖趣味關(guān)卡，留住玩耍美好時光！

震撼！海口頂豪“素顏出境”，直接頂穿品質(zhì)天花板！

硬核數(shù)據(jù)“起飛”！這所高增值名校早該火了！

違規(guī)干細胞抗衰美容，為何肆無忌憚

男子帶20萬練功券約見女主播發(fā)生關(guān)系后騙走對方1萬

男子帶20萬練功券約見女主播發(fā)生關(guān)系后騙走對方1萬

王俊杰11前板成第一尖刀媒體人：獨一檔

北京現(xiàn)代5月銷量強勢反彈:國內(nèi)17065輛出口環(huán)比翻倍