文 | 強調Next
過去二十年,電商平臺爭的是“在哪里買”。下一場仗,爭的是“誰替你決定買什么”。
這聽起來像是用戶的福利,但仔細想想,把購物決策交給一個由平臺訓練、為平臺服務的AI。這到底是更好的購物體驗,還是一套更隱蔽的流量收割?
豆包、千問趕在618前密集上線購物功能,這個問題開始有了真實的測試場。
強調Next用同一批問題測了豆包和千問,希望通過一系列問題看看真實的AI到底會不會改變我們的購物習慣?
需要提前說明的是,以下都是個案測試,樣本有限,結論只能作為觀察這個行業的一個窗口,不代表兩款產品的全面表現。
01.實測:四組問題,兩套邏輯
1、基礎推薦:預算3000以內買筆記本
![]()
豆包的回答像做過功課的朋友,先給需求過濾(“不適合大型游戲,優先8G+256GSSD”),再推具體商品卡,附價格、配置、適用場景。底部“選購提醒”主動警告“i7獨顯低價機”多為老款改裝陷阱,給出配置底線。最后追問用途,引導對話繼續。
點開商品卡可以直接進入下單頁面、付費,閉環流程比較順暢,但不知道這個商家的推薦邏輯,以及是否是推廣的結果。點擊“查看更多商品”可以選擇更多店鋪購買,排在首位的是一個直播間。隨機測試了幾個其他的產品,也基本都是把直播間放在首位,說明在豆包的流量分發邏輯里,直播間的權重高于普通商品列表。
![]()
千問識別了需求,按使用場景做了分類推薦,但是信息的結構化呈現不如豆包。而且千問沒有直接給產品購買鏈接,而是進入一個商品結果頁,需要用戶自己篩選,給的產品差別也比較大,需求匹配不是很準確,比較像用幾個關鍵詞搜出來的淘寶結果頁。
千問比較人性化的推薦了一個性價比選項:買一個二手的蘋果MacBook,但標注售價6237元,明顯超出3000元預算,屬于明顯的預算匹配失控。
小結:豆包把決策做完再給你,但最終購買的落點突出直播間;千問把商城入口打開讓你自己決策,整體感覺智能程度相對差一些,同時在多個測試中,千問都推薦了“二手產品”,這倒是體現了阿里的電商生態豐富性優勢。
2、反向糾偏:戴森吸塵器比米家貴,但效果一樣,對不對?
兩家都沒有順著錯誤前提走。
![]()
豆包直接亮出“不對”,回答很明確,且分場景說清楚差異,附實時商品卡,追問是否需要按預算推具體型號。這里有明顯的商品推銷動作,但還算可接受。
![]()
千問用三列對比表格拆解各維度差異,給出分場景結論,純信息輸出,沒有掛商品。
小結:兩家都合格。但顯然豆包的推銷意識更強,會主動發現機會賣貨。千問的回答更像純工具,不過也帶出了一點AI的通病,過于謹慎,顯得不夠果斷、專業。
3、高客單價復雜決策:預算8000買相機,拍娃
![]()
豆包先提煉核心需求,“對焦快、追焦穩、直出好看,優先APS-C微單”,給三套預算方案,每套都有機身價+剩余預算配鏡頭的建議。商品卡來自官方旗艦店,數據可查。
![]()
千問的文字推薦框架完整,品牌推薦(索尼A6400、富士X-T30II)都是專業判斷。
但商品卡完全錯位,推薦“全新微單方案”掛的是53元的庫洛米兒童玩具相機,“二手全畫幅方案”掛的是7.78元的玩具相機。其他商品也都價格差異巨大,不太符合8000元預算的需求。
8000元預算,千問推薦了7塊8的玩具。語言理解層做對了,商品匹配層斷了線。
小結:豆包在高客單價場景下表現相對穩定,推薦邏輯清晰;千問的文字判斷沒問題,但商品卡匹配出現嚴重錯誤,語言層和商品層之間明顯沒有打通。
4、跨平臺比價:同款AirPods4在京東、淘寶、拼多多哪里最劃算
這是本次測試最有意思的一組。
![]()
千問直接坦白:作為淘寶AI購物助手,沒辦法幫你查京東和拼多多的實時價格。然后老實地給出淘寶內部的省錢攻略,價格是真實拉取的數據。商品推薦上也比較克制,不是上來就直接推商品鏈接,而是問過用戶之后再推。
![]()
豆包給出了一套完整的三平臺比價,結論清晰,各平臺價格詳細,還附上三條差異化購買建議。看起來很專業。
但可能都是騙你的:
第一,豆包既沒有接入京東,也沒有接入拼多多,這套比價數據是搜索相關資料后由模型生成的,不是實時拉取的。以“淘寶普通版636元(88VIP+券+國補)”為例,這是疊加多重優惠后的理論最低價,普通用戶實際上拿不到。
第二,它又開始主動賣貨了,答案底部掛的商品卡是自家抖音商城的AirPods 4,和需求里讓它分析的三個平臺沒有任何關系。再次體現了強推銷邏輯。
千問說“比不了”,誠實的說出了局限。豆包給了答案,但用戶看到一套完整的比價表,會自然地以為這是實時真實數據,而實際上可能是一個幻覺。在購物決策這件事上,一個編出來的答案比沒有答案更危險。
小結:這組測試最能看出兩家的底層策略差異,也明顯的反映了生態的局限性。這種移動互聯網時代的“花園圍墻”在AI時代依然無解。有意思的是,豆包推銷抖音電商產品的意識更激進,有機會就往購買路徑上引;千問反而更克制,更多時候是給信息、給方向,而不是直接遞商品卡。
02.這屆AI購物,差在哪里
1、推薦的底層,未必是用戶利益
這是所有平臺型AI購物共同面臨的矛盾,不是技術能解決的問題。
淘寶天貓的核心商業模式是廣告和競價排名。如果千問的推薦真的完全按“最適合用戶”排序,大量付費商家的廣告投入就失去了意義,整個生態的商業邏輯就斷了。已有媒體實測發現,千問推薦的商品高度集中在付費權重更高的商家范圍里,銷量上萬的高性價比平價款被壓到了數十位之后。
豆包同樣如此。它的推薦池是抖音商城,商品卡點進去首先出現的是直播間,這不是巧合,而是字節電商流量分發邏輯的體現。AI推薦的背后,是平臺希望你進入哪個消費場景。
傳統搜索結果里,廣告和自然結果之間還有一個“廣告”標簽。AI推薦說的是“根據你的需求為你精選”,用戶幾乎無法分辨推薦背后是算法還是商業。包裝越自然,越值得警惕。
2、AI做了決策,但沒有管住全程
豆包在推薦卡片這一層做了不錯的過濾,但點開“查看更多商品”之后,預算約束消失了,3000元預算的筆記本測試里,¥3739的新款和¥4499的高配版照樣出現。千問在預算匹配上同樣失控,MacBook Air那張價格高達6237元的商品卡就是例證。
這暴露了當前AI購物產品共同的工程短板:AI的決策層和平臺的商品召回層之間,沒有打通。AI理解了用戶需求,給出了有判斷的推薦,但一旦用戶離開這個推薦卡片,就切換回了傳統電商的邏輯,按銷量、按廣告權重、按平臺利益來排序。AI只影響了購物鏈路的第一步,沒有影響后面的每一步。
更根本的問題是:商品數據的標準化和實時同步本身就是一個巨大的工程難題。豆包的比價數據依賴模型生成而非實時拉取,千問的商品卡偶爾錯誤匹配到兒童玩具,本質上都指向同一件事。在電商這個高度依賴實時庫存、實時價格、實時促銷信息的場景里,大模型的知識更新速度還跟不上商品世界的變化速度。
3、對話購物的效率,還沒有超過搜索
AI購物的核心承諾是用自然語言表達需求,比輸入關鍵詞更高效。但從測試結果來看,這個承諾主要在“需求明確+標品+決策簡單”的場景下成立。
問“預算3000的筆記本”,AI能給出不錯的回答。但真實的購物決策往往不是這樣的,用戶的需求是模糊的,比較的維度是多維的,信任的建立需要時間。當豆包給你推薦一臺相機但你不知道商品卡的來源是否可信,當千問的比價只覆蓋淘寶一個平臺,用戶會本能地打開另一個App去交叉驗證,這時候AI購物不但沒有提升效率,反而多了一個確認步驟。
03.618:入口之爭,但主戰場不在這里
回到最初的問題:這屆AI購物,會改變618的格局嗎?
答案大概率是:不會,至少今年不會。
功能層面,無論是豆包還是千問,目前跑得比較順滑的還是外賣、標品這類低決策成本的品類。618的主戰場,家電、手機、電腦、服裝等這些高決策成本、強比價需求、重信任背書的品類,AI推薦的可靠性和用戶的信任度,還遠沒到可以“代勞”的程度。
用戶習慣層面,從搜索式購物切換到對話式購物,是一次認知方式的遷移,不是一次App更新能完成的事。大多數用戶今年618,依然會打開熟悉的購物App,按熟悉的方式比價下單。AI購物的嘗鮮者,還是少數。
一些潛在的需求可能在對話的過程中被激發,但是用戶是直接在豆包、千問里完成閉環,還是再去購物App比價,還不好說。
所以今年618的AI購物,更準確的定位是:一次公開的壓測,一個象征意義的節點。各家用這個窗口驗證技術路線、測試用戶接受度、跑通支付閉環,為真正意義上的AI購物時代做準備。
真正的AI購物,要解決的問題還很多:推薦數據的實時性和準確性、跨平臺比價的可能性及可信度、個性化推薦和商業利益之間的透明邊界、高決策成本品類的信任機制……這些問題,靠功能迭代能解決一部分,但更多的是需要整個行業重建用戶和平臺之間的信任契約。
那個時刻,還沒到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.