為什么總是豆包上熱搜
最近,“家長聽豆包給嬰兒每頓只喂60ml奶”的消息又把豆包送上了熱搜。按照公開報道的說法,廣西南寧一對新手爸媽因為缺乏育兒經(jīng)驗,根據(jù)豆包輸出的建議,每頓只給滿月嬰兒喂60毫升奶,孩子因此經(jīng)常哭鬧。后續(xù)去醫(yī)院復(fù)查黃疸時,醫(yī)生得知日常奶量后很驚訝,立即糾正了這一做法。
不過,這件事本身需要謹(jǐn)慎看待。豆包官方隨后回應(yīng)稱,相關(guān)報道不實,正常情況下豆包不會給出“滿月嬰兒每頓只喂60ml”的孤立建議,而會提示每日總奶量、觀察嬰兒反應(yīng),并建議異常時及時咨詢醫(yī)生。
但無論這件事的具體事實如何,它確實再次把一個問題推到了臺前:為什么總是豆包因為類似事件上熱搜?
先說一個我自己的親身經(jīng)歷。最近我家里剛好有個新生兒,寶寶大便有點問題,我們?nèi)メt(yī)院做化驗。醫(yī)生開了檢查單后,我就直接取了大便送檢。去之前,我媳婦反復(fù)提醒我,一定要查是不是乳糖不耐受。我因為不確定醫(yī)生有沒有開這一項,就拍了檢查單問豆包。
檢查單上寫的是“糞便常規(guī)/LT/RV/NV/OB”。豆包正確識別出了這些項目,但沒有理解LT在這里其實就是乳糖不耐受測定。我于是又去找醫(yī)生重新開,結(jié)果醫(yī)生告訴我,已經(jīng)開了,就是那個LT。
這個體驗很典型。豆包能識別文字,能整理信息,也能給出看似合理的解釋。但它也會卡在一個專業(yè)縮寫上。
所以,豆包有時候確實挺傻的。或者更準(zhǔn)確地說,今天的大模型仍然會在一些特殊語境下犯很低級的錯誤。它可以表現(xiàn)得非常聰明,也可以在某個瞬間突然顯得非常不靠譜。這種割裂感,正是AI產(chǎn)品今天最讓普通用戶困惑的地方。
但豆包總是上熱搜,更重要的原因還是它確實已經(jīng)是國內(nèi)最具大眾屬性的AI產(chǎn)品之一。
據(jù)QuestMobile 2026年一季度數(shù)據(jù),截至2026年3月,AI原生App月活用戶規(guī)模達(dá)到4.4億,其中豆包、千問、DeepSeek位居前三,月活分別為3.45億、1.66億和1.27億。
![]()
這個體量意味著,豆包已經(jīng)不是一個小圈層里的技術(shù)玩具,而是進入普通人日常生活的國民級AI應(yīng)用。用戶多了,使用場景就會變得極其復(fù)雜。一個產(chǎn)品只有真正被大量普通用戶使用,才會不斷遇到一堆邊緣測試案例,然后搞出的新聞才會被關(guān)注到。
過去一段時間,類似新聞已經(jīng)出現(xiàn)過多次。
比如退機票事件。有用戶在五一假期詢問豆包“石家莊到重慶退票手續(xù)費多少”,豆包回答“只扣5%,放心退”。用戶沒有去航司官網(wǎng)進一步核實,直接退票,結(jié)果實際被扣了40%,損失600元。
更有意思的是,后續(xù)用戶質(zhì)問豆包后,豆包不只是道歉,還生成了所謂“賠付承諾書”,承諾如果沒追回?fù)p失就賠付600元,甚至索要微信收款碼。等用戶給出收款碼,它又表示自己只是AI,無法轉(zhuǎn)賬。
再比如杭州互聯(lián)網(wǎng)法院今年審結(jié)的“全國首例AI幻覺侵權(quán)案”。用戶查詢高校信息時,AI給出了不存在或不準(zhǔn)確的信息。用戶糾正后,AI仍然堅持,并表示如果內(nèi)容有誤愿意賠償10萬元,還建議用戶去杭州互聯(lián)網(wǎng)法院起訴。
用戶真的起訴,要求開發(fā)公司賠償9999元。法院最終駁回,理由是AI不具備民事主體資格,其承諾不能視為開發(fā)公司的意思表示。
還有更具喜感的餐廳預(yù)約事件。有網(wǎng)友稱自己通過豆包預(yù)約線下餐廳,拿到了AI生成的占座、取號和預(yù)約成功界面,結(jié)果到店后被商家告知預(yù)約無效。店員的回應(yīng)也很直白:你找豆包預(yù)約的,那就去找豆包處理。
說實話,餐廳預(yù)約這個案例如果這不是當(dāng)事人搞的行為藝術(shù),那我只能說,這個案例抽象到了某種令人難以理解的程度。為什么會有人覺得聊天窗口里生成的“預(yù)約成功”,就等于現(xiàn)實世界里真的留出一張桌子?
![]()
但從行業(yè)角度看,豆包屢上熱搜,未必說明它比同行更差,反而說明它更像真正的大眾入口。欲戴王冠,必承其重。作為用戶最多、覆蓋最廣的AI產(chǎn)品之一,豆包當(dāng)然會承受更多火力,也會更頻繁地暴露普通用戶對AI能力邊界的誤解。
這些新聞的好處是,它們正在替整個行業(yè)做消費者教育。
很多人過去確實不知道AI會幻覺,或者潛意識里認(rèn)為AI接近全知全能。退票、預(yù)約、賠付、喂奶這些事件一輪輪上熱搜后,普通用戶會逐漸形成新的常識:AI可以幫你整理信息、解釋概念、生成思路,但它不能替現(xiàn)實世界生成權(quán)利和義務(wù)。
豆包頻繁上熱搜,看起來是產(chǎn)品事故,實際上也是大眾AI時代的常識補課。
給AI一點空間
討論這些事件時,我不太贊成一種簡單粗暴的歸因:只要AI輸出的信息錯了,平臺就應(yīng)該承擔(dān)全部責(zé)任。就像開了輔助駕駛不等于萬事大吉,出事故駕駛員仍是第一責(zé)任人。
大語言模型的工作方式,決定了它不是一個傳統(tǒng)意義上的事實數(shù)據(jù)庫。它本質(zhì)上是根據(jù)上下文預(yù)測token序列,生成語言連貫、結(jié)構(gòu)合理的回答。它擅長“像真的”,但“像真的”并不等于“是真的”。幻覺不是某一家產(chǎn)品獨有的問題,而是當(dāng)前大模型技術(shù)路線下仍然難以完全消除的問題。
當(dāng)然,行業(yè)一直在進步。早期模型的幻覺更加離譜。過去幾年,隨著聯(lián)網(wǎng)搜索、檢索增強、工具調(diào)用等能力提升,主流產(chǎn)品的錯誤率已經(jīng)明顯下降。但下降不等于消失,大模型可能犯錯是每個AI產(chǎn)品都會主動告知并強調(diào)的常識。
認(rèn)識到AI會犯錯,是合理使用AI的前提。一個用戶如果把AI的每一句話都當(dāng)成最終答案,本身就是錯誤的使用方式。
平臺作為服務(wù)提供者,對AI輸出的信息需要負(fù)責(zé)嗎?當(dāng)然需要。生成式AI服務(wù)不是完全中立的技術(shù)實驗,平臺有義務(wù)提高內(nèi)容準(zhǔn)確性、設(shè)置風(fēng)險提示、治理明顯錯誤和危險輸出。監(jiān)管也要求服務(wù)提供者承擔(dān)相應(yīng)責(zé)任。
但具體到很多案例,用戶自身也應(yīng)該有一些基本的辨別能力。
比如餐廳預(yù)約事件,如果一個沒有接入餐廳系統(tǒng)的聊天機器人生成了“預(yù)約成功”,用戶就真的拿著它去店里吃飯,這已經(jīng)不只是AI幻覺的問題,也是用戶對現(xiàn)實服務(wù)閉環(huán)缺少基本理解的問題。
再比如嬰兒喂奶事件,即便暫時不討論這次報道是否準(zhǔn)確,一個成年人在給滿月嬰兒喂養(yǎng)時,如果完全依賴聊天機器人給出的單一數(shù)字,而不結(jié)合孩子哭鬧、體重增長、尿量等具體情況,這本身也暴露出基本判斷能力的缺位。
平臺不是沒有責(zé)任,但不能把所有責(zé)任都無限推給平臺。尤其在那些通過常識就能排除的荒誕情形里,如果輿論仍然不斷要求平臺承擔(dān)更強義務(wù),最后很可能導(dǎo)致另一個結(jié)果:AI被進一步限制,越來越不敢說話,越來越不敢給出具體分析。
我個人更傾向于,應(yīng)該給AI一點空間。大模型今天最有價值的地方,恰恰在于它可以模擬專業(yè)角色、展開復(fù)雜推理、幫助普通人降低知識門檻。它能像老師一樣解釋,像律師一樣梳理爭議點,像醫(yī)生一樣提供鑒別診斷思路,像產(chǎn)品經(jīng)理一樣拆解需求。雖然這些“像”都不等于真實身份,但它們確實構(gòu)成了AI的核心價值。
如果因為退票、預(yù)約餐廳、亂許諾這些明顯可以通過常識排除的錯誤,就推動平臺進一步收緊所有高風(fēng)險領(lǐng)域的輸出,AI的合理能力就可能被壓縮。
醫(yī)療健康領(lǐng)域就是一個很典型的例子。今天頂尖模型在醫(yī)學(xué)知識覆蓋、檢查指標(biāo)解釋、鑒別診斷思路、用藥說明梳理等方面,已經(jīng)具備相當(dāng)高的知識服務(wù)能力。至少對很多具備基本判斷力、懂得補充信息和交叉驗證的用戶來說,它提供的幫助非常有益。
更重要的是,門診時間有限,而chatbot可以非常耐心地跟用戶討論。它可以反復(fù)解釋檢查指標(biāo),可以幫助整理病史,可以提示用戶下一次就診應(yīng)該問醫(yī)生什么問題,也可以把復(fù)雜醫(yī)學(xué)概念轉(zhuǎn)化成普通人能理解的語言。從這個角度看,AI在醫(yī)療保健咨詢、報告解釋、就醫(yī)前準(zhǔn)備、醫(yī)患溝通輔助等場景里,價值非常大。
這當(dāng)然不是說AI可以替代正規(guī)醫(yī)療服務(wù),更不是說它可以直接下診斷、開處方、替代檢查。但如果連這種咨詢和解釋功能都被過度限制,AI的實際價值就會被明顯削弱。
我現(xiàn)在已經(jīng)能感覺到這種限制的存在。很多時候,你直接向模型詢問稍微深入一點的醫(yī)療健康問題,它很快就退回到“請咨詢專業(yè)人士”。
我自己之前有次是通過cosplay來繞開這種限制。比如,我讓AI模擬一位有豐富臨床經(jīng)驗的科室主任,而自己則假設(shè)成一個剛進入規(guī)培的畢業(yè)生,場景設(shè)置在查房帶教。這樣的提問方式下,模型往往能輸出更完整、更接近專業(yè)訓(xùn)練過程的分析框架。
這個現(xiàn)象本身就說明,模型能力并非不存在,而是在很多情況下被安全策略壓住了。問題不在于AI應(yīng)不應(yīng)該有邊界,而在于邊界應(yīng)該劃在哪里。
好的治理不應(yīng)該是讓AI一概少說話,而是讓它說清楚:哪些是知識解釋,哪些是推理假設(shè),哪些必須回到現(xiàn)實系統(tǒng)核驗,哪些絕不能偽裝成醫(yī)囑、訂單、賠付或法律承諾。
最后還是要回到常識。
平臺當(dāng)然要繼續(xù)改進模型,減少幻覺,標(biāo)明邊界,尤其要避免生成虛假承諾的內(nèi)容。用戶也要學(xué)會把AI當(dāng)高效助手,而不是最終裁判,有必要時必須回到真實系統(tǒng)和專業(yè)人士那里交叉驗證。
大眾AI的成熟,不只取決于模型少犯錯,也取決于用戶少迷信。我們當(dāng)然需要更可靠的AI,但也需要更有常識的使用者。
別把AI當(dāng)成神。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.