豆包頻上熱搜背后：AI的價值、幻覺與常識

2026-05-31 00:31:32　來源: 象先志

福建舉報

分享至

為什么總是豆包上熱搜

最近，“家長聽豆包給嬰兒每頓只喂60ml奶”的消息又把豆包送上了熱搜。按照公開報道的說法，廣西南寧一對新手爸媽因為缺乏育兒經(jīng)驗，根據(jù)豆包輸出的建議，每頓只給滿月嬰兒喂60毫升奶，孩子因此經(jīng)常哭鬧。后續(xù)去醫(yī)院復(fù)查黃疸時，醫(yī)生得知日常奶量后很驚訝，立即糾正了這一做法。

不過，這件事本身需要謹(jǐn)慎看待。豆包官方隨后回應(yīng)稱，相關(guān)報道不實，正常情況下豆包不會給出“滿月嬰兒每頓只喂60ml”的孤立建議，而會提示每日總奶量、觀察嬰兒反應(yīng)，并建議異常時及時咨詢醫(yī)生。

但無論這件事的具體事實如何，它確實再次把一個問題推到了臺前：為什么總是豆包因為類似事件上熱搜？

先說一個我自己的親身經(jīng)歷。最近我家里剛好有個新生兒，寶寶大便有點問題，我們?nèi)メt(yī)院做化驗。醫(yī)生開了檢查單后，我就直接取了大便送檢。去之前，我媳婦反復(fù)提醒我，一定要查是不是乳糖不耐受。我因為不確定醫(yī)生有沒有開這一項，就拍了檢查單問豆包。

檢查單上寫的是“糞便常規(guī)/LT/RV/NV/OB”。豆包正確識別出了這些項目，但沒有理解LT在這里其實就是乳糖不耐受測定。我于是又去找醫(yī)生重新開，結(jié)果醫(yī)生告訴我，已經(jīng)開了，就是那個LT。

這個體驗很典型。豆包能識別文字，能整理信息，也能給出看似合理的解釋。但它也會卡在一個專業(yè)縮寫上。

所以，豆包有時候確實挺傻的。或者更準(zhǔn)確地說，今天的大模型仍然會在一些特殊語境下犯很低級的錯誤。它可以表現(xiàn)得非常聰明，也可以在某個瞬間突然顯得非常不靠譜。這種割裂感，正是AI產(chǎn)品今天最讓普通用戶困惑的地方。

但豆包總是上熱搜，更重要的原因還是它確實已經(jīng)是國內(nèi)最具大眾屬性的AI產(chǎn)品之一。

據(jù)QuestMobile 2026年一季度數(shù)據(jù)，截至2026年3月，AI原生App月活用戶規(guī)模達(dá)到4.4億，其中豆包、千問、DeepSeek位居前三，月活分別為3.45億、1.66億和1.27億。

這個體量意味著，豆包已經(jīng)不是一個小圈層里的技術(shù)玩具，而是進入普通人日常生活的國民級AI應(yīng)用。用戶多了，使用場景就會變得極其復(fù)雜。一個產(chǎn)品只有真正被大量普通用戶使用，才會不斷遇到一堆邊緣測試案例，然后搞出的新聞才會被關(guān)注到。

過去一段時間，類似新聞已經(jīng)出現(xiàn)過多次。

比如退機票事件。有用戶在五一假期詢問豆包“石家莊到重慶退票手續(xù)費多少”，豆包回答“只扣5%，放心退”。用戶沒有去航司官網(wǎng)進一步核實，直接退票，結(jié)果實際被扣了40%，損失600元。

更有意思的是，后續(xù)用戶質(zhì)問豆包后，豆包不只是道歉，還生成了所謂“賠付承諾書”，承諾如果沒追回?fù)p失就賠付600元，甚至索要微信收款碼。等用戶給出收款碼，它又表示自己只是AI，無法轉(zhuǎn)賬。

再比如杭州互聯(lián)網(wǎng)法院今年審結(jié)的“全國首例AI幻覺侵權(quán)案”。用戶查詢高校信息時，AI給出了不存在或不準(zhǔn)確的信息。用戶糾正后，AI仍然堅持，并表示如果內(nèi)容有誤愿意賠償10萬元，還建議用戶去杭州互聯(lián)網(wǎng)法院起訴。

用戶真的起訴，要求開發(fā)公司賠償9999元。法院最終駁回，理由是AI不具備民事主體資格，其承諾不能視為開發(fā)公司的意思表示。

還有更具喜感的餐廳預(yù)約事件。有網(wǎng)友稱自己通過豆包預(yù)約線下餐廳，拿到了AI生成的占座、取號和預(yù)約成功界面，結(jié)果到店后被商家告知預(yù)約無效。店員的回應(yīng)也很直白：你找豆包預(yù)約的，那就去找豆包處理。

說實話，餐廳預(yù)約這個案例如果這不是當(dāng)事人搞的行為藝術(shù)，那我只能說，這個案例抽象到了某種令人難以理解的程度。為什么會有人覺得聊天窗口里生成的“預(yù)約成功”，就等于現(xiàn)實世界里真的留出一張桌子？

但從行業(yè)角度看，豆包屢上熱搜，未必說明它比同行更差，反而說明它更像真正的大眾入口。欲戴王冠，必承其重。作為用戶最多、覆蓋最廣的AI產(chǎn)品之一，豆包當(dāng)然會承受更多火力，也會更頻繁地暴露普通用戶對AI能力邊界的誤解。

這些新聞的好處是，它們正在替整個行業(yè)做消費者教育。

很多人過去確實不知道AI會幻覺，或者潛意識里認(rèn)為AI接近全知全能。退票、預(yù)約、賠付、喂奶這些事件一輪輪上熱搜后，普通用戶會逐漸形成新的常識：AI可以幫你整理信息、解釋概念、生成思路，但它不能替現(xiàn)實世界生成權(quán)利和義務(wù)。

豆包頻繁上熱搜，看起來是產(chǎn)品事故，實際上也是大眾AI時代的常識補課。

給AI一點空間

討論這些事件時，我不太贊成一種簡單粗暴的歸因：只要AI輸出的信息錯了，平臺就應(yīng)該承擔(dān)全部責(zé)任。就像開了輔助駕駛不等于萬事大吉，出事故駕駛員仍是第一責(zé)任人。

大語言模型的工作方式，決定了它不是一個傳統(tǒng)意義上的事實數(shù)據(jù)庫。它本質(zhì)上是根據(jù)上下文預(yù)測token序列，生成語言連貫、結(jié)構(gòu)合理的回答。它擅長“像真的”，但“像真的”并不等于“是真的”。幻覺不是某一家產(chǎn)品獨有的問題，而是當(dāng)前大模型技術(shù)路線下仍然難以完全消除的問題。

當(dāng)然，行業(yè)一直在進步。早期模型的幻覺更加離譜。過去幾年，隨著聯(lián)網(wǎng)搜索、檢索增強、工具調(diào)用等能力提升，主流產(chǎn)品的錯誤率已經(jīng)明顯下降。但下降不等于消失，大模型可能犯錯是每個AI產(chǎn)品都會主動告知并強調(diào)的常識。

認(rèn)識到AI會犯錯，是合理使用AI的前提。一個用戶如果把AI的每一句話都當(dāng)成最終答案，本身就是錯誤的使用方式。

平臺作為服務(wù)提供者，對AI輸出的信息需要負(fù)責(zé)嗎？當(dāng)然需要。生成式AI服務(wù)不是完全中立的技術(shù)實驗，平臺有義務(wù)提高內(nèi)容準(zhǔn)確性、設(shè)置風(fēng)險提示、治理明顯錯誤和危險輸出。監(jiān)管也要求服務(wù)提供者承擔(dān)相應(yīng)責(zé)任。

但具體到很多案例，用戶自身也應(yīng)該有一些基本的辨別能力。

比如餐廳預(yù)約事件，如果一個沒有接入餐廳系統(tǒng)的聊天機器人生成了“預(yù)約成功”，用戶就真的拿著它去店里吃飯，這已經(jīng)不只是AI幻覺的問題，也是用戶對現(xiàn)實服務(wù)閉環(huán)缺少基本理解的問題。

再比如嬰兒喂奶事件，即便暫時不討論這次報道是否準(zhǔn)確，一個成年人在給滿月嬰兒喂養(yǎng)時，如果完全依賴聊天機器人給出的單一數(shù)字，而不結(jié)合孩子哭鬧、體重增長、尿量等具體情況，這本身也暴露出基本判斷能力的缺位。

平臺不是沒有責(zé)任，但不能把所有責(zé)任都無限推給平臺。尤其在那些通過常識就能排除的荒誕情形里，如果輿論仍然不斷要求平臺承擔(dān)更強義務(wù)，最后很可能導(dǎo)致另一個結(jié)果：AI被進一步限制，越來越不敢說話，越來越不敢給出具體分析。

我個人更傾向于，應(yīng)該給AI一點空間。大模型今天最有價值的地方，恰恰在于它可以模擬專業(yè)角色、展開復(fù)雜推理、幫助普通人降低知識門檻。它能像老師一樣解釋，像律師一樣梳理爭議點，像醫(yī)生一樣提供鑒別診斷思路，像產(chǎn)品經(jīng)理一樣拆解需求。雖然這些“像”都不等于真實身份，但它們確實構(gòu)成了AI的核心價值。

如果因為退票、預(yù)約餐廳、亂許諾這些明顯可以通過常識排除的錯誤，就推動平臺進一步收緊所有高風(fēng)險領(lǐng)域的輸出，AI的合理能力就可能被壓縮。

醫(yī)療健康領(lǐng)域就是一個很典型的例子。今天頂尖模型在醫(yī)學(xué)知識覆蓋、檢查指標(biāo)解釋、鑒別診斷思路、用藥說明梳理等方面，已經(jīng)具備相當(dāng)高的知識服務(wù)能力。至少對很多具備基本判斷力、懂得補充信息和交叉驗證的用戶來說，它提供的幫助非常有益。

更重要的是，門診時間有限，而chatbot可以非常耐心地跟用戶討論。它可以反復(fù)解釋檢查指標(biāo)，可以幫助整理病史，可以提示用戶下一次就診應(yīng)該問醫(yī)生什么問題，也可以把復(fù)雜醫(yī)學(xué)概念轉(zhuǎn)化成普通人能理解的語言。從這個角度看，AI在醫(yī)療保健咨詢、報告解釋、就醫(yī)前準(zhǔn)備、醫(yī)患溝通輔助等場景里，價值非常大。

這當(dāng)然不是說AI可以替代正規(guī)醫(yī)療服務(wù)，更不是說它可以直接下診斷、開處方、替代檢查。但如果連這種咨詢和解釋功能都被過度限制，AI的實際價值就會被明顯削弱。

我現(xiàn)在已經(jīng)能感覺到這種限制的存在。很多時候，你直接向模型詢問稍微深入一點的醫(yī)療健康問題，它很快就退回到“請咨詢專業(yè)人士”。

我自己之前有次是通過cosplay來繞開這種限制。比如，我讓AI模擬一位有豐富臨床經(jīng)驗的科室主任，而自己則假設(shè)成一個剛進入規(guī)培的畢業(yè)生，場景設(shè)置在查房帶教。這樣的提問方式下，模型往往能輸出更完整、更接近專業(yè)訓(xùn)練過程的分析框架。

這個現(xiàn)象本身就說明，模型能力并非不存在，而是在很多情況下被安全策略壓住了。問題不在于AI應(yīng)不應(yīng)該有邊界，而在于邊界應(yīng)該劃在哪里。

好的治理不應(yīng)該是讓AI一概少說話，而是讓它說清楚：哪些是知識解釋，哪些是推理假設(shè)，哪些必須回到現(xiàn)實系統(tǒng)核驗，哪些絕不能偽裝成醫(yī)囑、訂單、賠付或法律承諾。

最后還是要回到常識。

平臺當(dāng)然要繼續(xù)改進模型，減少幻覺，標(biāo)明邊界，尤其要避免生成虛假承諾的內(nèi)容。用戶也要學(xué)會把AI當(dāng)高效助手，而不是最終裁判，有必要時必須回到真實系統(tǒng)和專業(yè)人士那里交叉驗證。

大眾AI的成熟，不只取決于模型少犯錯，也取決于用戶少迷信。我們當(dāng)然需要更可靠的AI，但也需要更有常識的使用者。

別把AI當(dāng)成神。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.