網易首頁 > 網易號 > 正文申請入駐

豆包、千問618 購物實測：這屆AI還沒學會賣貨

2026-06-03 12:34:17　來源: 鈦媒體APP

北京舉報

分享至

文 | 強調Next

過去二十年，電商平臺爭的是“在哪里買”。下一場仗，爭的是“誰替你決定買什么”。

這聽起來像是用戶的福利，但仔細想想，把購物決策交給一個由平臺訓練、為平臺服務的AI。這到底是更好的購物體驗，還是一套更隱蔽的流量收割？

豆包、千問趕在618前密集上線購物功能，這個問題開始有了真實的測試場。

強調Next用同一批問題測了豆包和千問，希望通過一系列問題看看真實的AI到底會不會改變我們的購物習慣？

需要提前說明的是，以下都是個案測試，樣本有限，結論只能作為觀察這個行業的一個窗口，不代表兩款產品的全面表現。

01.實測：四組問題，兩套邏輯

1、基礎推薦：預算3000以內買筆記本

豆包的回答像做過功課的朋友，先給需求過濾（“不適合大型游戲，優先8G+256GSSD”），再推具體商品卡，附價格、配置、適用場景。底部“選購提醒”主動警告“i7獨顯低價機”多為老款改裝陷阱，給出配置底線。最后追問用途，引導對話繼續。

點開商品卡可以直接進入下單頁面、付費，閉環流程比較順暢，但不知道這個商家的推薦邏輯，以及是否是推廣的結果。點擊“查看更多商品”可以選擇更多店鋪購買，排在首位的是一個直播間。隨機測試了幾個其他的產品，也基本都是把直播間放在首位，說明在豆包的流量分發邏輯里，直播間的權重高于普通商品列表。

千問識別了需求，按使用場景做了分類推薦，但是信息的結構化呈現不如豆包。而且千問沒有直接給產品購買鏈接，而是進入一個商品結果頁，需要用戶自己篩選，給的產品差別也比較大，需求匹配不是很準確，比較像用幾個關鍵詞搜出來的淘寶結果頁。

千問比較人性化的推薦了一個性價比選項：買一個二手的蘋果MacBook，但標注售價6237元，明顯超出3000元預算，屬于明顯的預算匹配失控。

小結：豆包把決策做完再給你，但最終購買的落點突出直播間；千問把商城入口打開讓你自己決策，整體感覺智能程度相對差一些，同時在多個測試中，千問都推薦了“二手產品”，這倒是體現了阿里的電商生態豐富性優勢。

2、反向糾偏：戴森吸塵器比米家貴，但效果一樣，對不對？

兩家都沒有順著錯誤前提走。

豆包直接亮出“不對”，回答很明確，且分場景說清楚差異，附實時商品卡，追問是否需要按預算推具體型號。這里有明顯的商品推銷動作，但還算可接受。

千問用三列對比表格拆解各維度差異，給出分場景結論，純信息輸出，沒有掛商品。

小結：兩家都合格。但顯然豆包的推銷意識更強，會主動發現機會賣貨。千問的回答更像純工具，不過也帶出了一點AI的通病，過于謹慎，顯得不夠果斷、專業。

3、高客單價復雜決策：預算8000買相機，拍娃

豆包先提煉核心需求，“對焦快、追焦穩、直出好看，優先APS-C微單”，給三套預算方案，每套都有機身價+剩余預算配鏡頭的建議。商品卡來自官方旗艦店，數據可查。

千問的文字推薦框架完整，品牌推薦（索尼A6400、富士X-T30II）都是專業判斷。

但商品卡完全錯位，推薦“全新微單方案”掛的是53元的庫洛米兒童玩具相機，“二手全畫幅方案”掛的是7.78元的玩具相機。其他商品也都價格差異巨大，不太符合8000元預算的需求。

8000元預算，千問推薦了7塊8的玩具。語言理解層做對了，商品匹配層斷了線。

小結：豆包在高客單價場景下表現相對穩定，推薦邏輯清晰；千問的文字判斷沒問題，但商品卡匹配出現嚴重錯誤，語言層和商品層之間明顯沒有打通。

4、跨平臺比價：同款AirPods4在京東、淘寶、拼多多哪里最劃算

這是本次測試最有意思的一組。

千問直接坦白：作為淘寶AI購物助手，沒辦法幫你查京東和拼多多的實時價格。然后老實地給出淘寶內部的省錢攻略，價格是真實拉取的數據。商品推薦上也比較克制，不是上來就直接推商品鏈接，而是問過用戶之后再推。

豆包給出了一套完整的三平臺比價，結論清晰，各平臺價格詳細，還附上三條差異化購買建議。看起來很專業。

但可能都是騙你的：

第一，豆包既沒有接入京東，也沒有接入拼多多，這套比價數據是搜索相關資料后由模型生成的，不是實時拉取的。以“淘寶普通版636元（88VIP+券+國補）”為例，這是疊加多重優惠后的理論最低價，普通用戶實際上拿不到。

第二，它又開始主動賣貨了，答案底部掛的商品卡是自家抖音商城的AirPods 4，和需求里讓它分析的三個平臺沒有任何關系。再次體現了強推銷邏輯。

千問說“比不了”，誠實的說出了局限。豆包給了答案，但用戶看到一套完整的比價表，會自然地以為這是實時真實數據，而實際上可能是一個幻覺。在購物決策這件事上，一個編出來的答案比沒有答案更危險。

小結：這組測試最能看出兩家的底層策略差異，也明顯的反映了生態的局限性。這種移動互聯網時代的“花園圍墻”在AI時代依然無解。有意思的是，豆包推銷抖音電商產品的意識更激進，有機會就往購買路徑上引；千問反而更克制，更多時候是給信息、給方向，而不是直接遞商品卡。

02.這屆AI購物，差在哪里

1、推薦的底層，未必是用戶利益

這是所有平臺型AI購物共同面臨的矛盾，不是技術能解決的問題。

淘寶天貓的核心商業模式是廣告和競價排名。如果千問的推薦真的完全按“最適合用戶”排序，大量付費商家的廣告投入就失去了意義，整個生態的商業邏輯就斷了。已有媒體實測發現，千問推薦的商品高度集中在付費權重更高的商家范圍里，銷量上萬的高性價比平價款被壓到了數十位之后。

豆包同樣如此。它的推薦池是抖音商城，商品卡點進去首先出現的是直播間，這不是巧合，而是字節電商流量分發邏輯的體現。AI推薦的背后，是平臺希望你進入哪個消費場景。

傳統搜索結果里，廣告和自然結果之間還有一個“廣告”標簽。AI推薦說的是“根據你的需求為你精選”，用戶幾乎無法分辨推薦背后是算法還是商業。包裝越自然，越值得警惕。

2、AI做了決策，但沒有管住全程

豆包在推薦卡片這一層做了不錯的過濾，但點開“查看更多商品”之后，預算約束消失了，3000元預算的筆記本測試里，￥3739的新款和￥4499的高配版照樣出現。千問在預算匹配上同樣失控，MacBook Air那張價格高達6237元的商品卡就是例證。

這暴露了當前AI購物產品共同的工程短板：AI的決策層和平臺的商品召回層之間，沒有打通。AI理解了用戶需求，給出了有判斷的推薦，但一旦用戶離開這個推薦卡片，就切換回了傳統電商的邏輯，按銷量、按廣告權重、按平臺利益來排序。AI只影響了購物鏈路的第一步，沒有影響后面的每一步。

更根本的問題是：商品數據的標準化和實時同步本身就是一個巨大的工程難題。豆包的比價數據依賴模型生成而非實時拉取，千問的商品卡偶爾錯誤匹配到兒童玩具，本質上都指向同一件事。在電商這個高度依賴實時庫存、實時價格、實時促銷信息的場景里，大模型的知識更新速度還跟不上商品世界的變化速度。

3、對話購物的效率，還沒有超過搜索

AI購物的核心承諾是用自然語言表達需求，比輸入關鍵詞更高效。但從測試結果來看，這個承諾主要在“需求明確+標品+決策簡單”的場景下成立。

問“預算3000的筆記本”，AI能給出不錯的回答。但真實的購物決策往往不是這樣的，用戶的需求是模糊的，比較的維度是多維的，信任的建立需要時間。當豆包給你推薦一臺相機但你不知道商品卡的來源是否可信，當千問的比價只覆蓋淘寶一個平臺，用戶會本能地打開另一個App去交叉驗證，這時候AI購物不但沒有提升效率，反而多了一個確認步驟。

03.618：入口之爭，但主戰場不在這里

回到最初的問題：這屆AI購物，會改變618的格局嗎？

答案大概率是：不會，至少今年不會。

功能層面，無論是豆包還是千問，目前跑得比較順滑的還是外賣、標品這類低決策成本的品類。618的主戰場，家電、手機、電腦、服裝等這些高決策成本、強比價需求、重信任背書的品類，AI推薦的可靠性和用戶的信任度，還遠沒到可以“代勞”的程度。

用戶習慣層面，從搜索式購物切換到對話式購物，是一次認知方式的遷移，不是一次App更新能完成的事。大多數用戶今年618，依然會打開熟悉的購物App，按熟悉的方式比價下單。AI購物的嘗鮮者，還是少數。

一些潛在的需求可能在對話的過程中被激發，但是用戶是直接在豆包、千問里完成閉環，還是再去購物App比價，還不好說。

所以今年618的AI購物，更準確的定位是：一次公開的壓測，一個象征意義的節點。各家用這個窗口驗證技術路線、測試用戶接受度、跑通支付閉環，為真正意義上的AI購物時代做準備。

真正的AI購物，要解決的問題還很多：推薦數據的實時性和準確性、跨平臺比價的可能性及可信度、個性化推薦和商業利益之間的透明邊界、高決策成本品類的信任機制……這些問題，靠功能迭代能解決一部分，但更多的是需要整個行業重建用戶和平臺之間的信任契約。

那個時刻，還沒到來。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.