![]()
微信Agent真的要來了。
微信開放平臺發布了這樣一條關于微信AI開發者指引的內容。
指引稱,為給用戶提供更智能的交互體驗,幫助用戶更敏捷地發現并使用小程序服務,微信開放平臺在充分尊重開發者權益和自主選擇的基礎上,為開發者提供便捷接入微信AI生態的能力。
接入后,小程序將有機會被微信AI推薦和調用。未完成接入的小程序,將無法被微信AI調用。
平臺提供了兩種接入模式。自動模式,授權平臺提審時讀取小程序源碼,無需投入額外開發。開發模式,開發者可基于小程序業務特性,自主個性化開發。
同一天,美團官宣率先接入微信AI生態。作為首批內測團隊,美團此前已與微信團隊聯合開發并測試接入。未來,用戶可通過微信AI調用美團外賣等本地生活服務。
攜程、同程等生活服務平臺也先后宣布接入微信。
早在幾天前,騰訊客服就表示,微信正在與華為、小米、榮耀、OPPO、vivo 等手機廠商合作推出A2A助手能力,目前已有多家廠商完成接入。
用戶可以通過對應手機系統的AI助手發起微信音視頻通話或向指定好友發送消息。
這其實不是第一次有關微信AI的消息了。早在今年3月,就有外媒表示,騰訊在微信內部推進一項高度保密的AI Agent項目。
6月2日,外媒發布消息稱,騰訊正在測試微信內置AI Agent原型,最快將于本月啟動合規審批流程。報道發布當天,騰訊股價收盤上漲10.5%,單日市值增加超過3000億港元,創下自2021年1月以來最大單日漲幅。
微信AI,或許就是騰訊AI下半場的終極答案。
01
微信AI的輪廓
看過早期演示的人士透露,用戶可以在微信主界面向右滑動,調出AI Agent的對話窗口。用戶輸入指令后,Agent會自動調用微信生態里的小程序,完成篩選、下單、預訂這類任務。
比如你說“幫我點一杯30元以內、不太甜、附近能自取的咖啡”,Agent就會自動調用微信里的小程序,幫你篩選咖啡店、匹配口味和價格,甚至完成下單流程。
光聽描述,它和豆包、千問這些AI聊天機器人沒什么區別。
但這里面特殊的地方在于,微信AI擁有整個微信生態的調度權。
騰訊在2025年年報中明確提到,目標是在微信生態內建設下一代Agentic services,把小程序、內容、社交和支付能力連接起來。截至2026年3月31日,微信及 WeChat 合并月活達14.32億。
也就是說,微信AI一旦上線,不管是好是壞,它都注定是一個超級應用。
微信里有數百萬個小程序,覆蓋打車、外賣、訂票、買菜等日常生活場景。國內頭部互聯網服務幾乎都在這一生態中設有小程序入口。
微信AI的核心能力,就是讓AI能夠調用這些小程序里的服務和交易能力,完成從認知到決策再到執行的完整閉環。
那它要怎么做呢?
首先是理解用戶意圖。用戶說“幫我訂個餐廳”,在家庭群里說和在工作群里說,意思完全不同。
誰在參與、誰能拍板、預算多少、有什么忌口、任務進行到了哪一步,這些都是Agent需要理解的上下文。難點在于微信里的任務天然跨越時間,家庭群討論暑假的對話可能斷斷續續持續好幾天。
然后是調用工具。
Agent需要動手,用搜一搜查信息,用小程序完成查詢和比價,用微信支付完成交易,用服務通知把結果反饋給用戶。
根據QuestMobile《2026全景生態流量春季報告》,小程序日活已超過9億,覆蓋幾百個細分領域。
現在工具箱足夠大了,問題是微信AI用得明白嗎?
騰訊在3月18日發布的論文中透露了一些技術細節。微信團隊開發了 UI-Oceanus,這是一個專門為小程序生態設計的世界模型。它的作用是預測操作結果。Agent找到了按鈕,但點下去會發生什么?頁面會跳轉到哪里?會彈出什么窗口?支付流程會不會啟動?
人類操作APP的時候對這些有直覺,Agent沒有這種直覺,所以它必須得從數據里學。
游戲AI學的是“按下這個鍵角色會怎么動”,小程序的世界模型學的是“點這個按鈕頁面會怎么變”。
直接在真實小程序環境里訓練太慢、太不穩定,所以 UI-Oceanus 自動模擬操作和頁面變化,生成了500萬樣本。這讓Agent可以在虛擬環境里學會操作小程序,然后再遷移到真實場景。
還有成本問題。14億月活的入口如果每個場景都觸發推理,成本是天文數字。騰訊需要在基礎任務用小模型,復雜任務調用強模型之間做平衡。這種多模型調度的能力,既要保證效果,又要控制成本。
最后是生態協調。
微信里的小程序太多了,服務質量、接口穩定性、商家配合度、支付流程、推薦排序、利益分配,每一項單拎出來都可以講很久。
AI Agent要替用戶辦事,就得真的辦成,不能嘴上答應得特別絲滑,結果點單點到半路開始迷路。
所以微信AI其實是一個非常復雜的工程,它要面對各種各樣的復雜場景。它還需要理解自然語言,需要調用小程序,需要處理支付,需要管理上下文,需要協調生態。
微信AI的輪廓清晰,只不過這個產品會比我們想象中要大得多。
02
為什么微信最適合承接這個 Agent
上下文越豐富,AI就越能理解你的真實意圖,做出的決策也就越準確。
而微信剛好是騰訊最大的上下文容器。
微信有關系鏈,14億用戶在微信里的社交關系、聊天記錄、群組對話,這些都是上下文。微信有小程序,數百萬個小程序覆蓋的服務場景,這些也是上下文。
微信有支付,用戶的消費習慣、支付記錄、交易偏好,這些還是上下文。
微信有內容,公眾號、視頻號、朋友圈里的信息流,這些同樣是上下文。
前一陣,騰訊推出了很多AI產品,比如元寶、ima、WorkBuddy、Marvis,他們看似相互獨立。實際上,它們都是在為微信AI積累能力。
這背后是騰訊內部一套叫做Co-Design的機制。
簡單來說,Co-Design就是產品團隊和模型團隊一起設計、一起優化。
傳統做法是,模型團隊先把模型訓練好,然后扔給產品團隊去用。產品團隊發現問題了,再反饋回來,模型團隊再調整。
這個過程很慢,而且經常出現“模型很強但產品不好用”的情況。
Co-Design的做法不一樣。元寶團隊會告訴混元團隊,用戶在真實場景里到底怎么提問、會遇到什么問題。混元團隊會根據這些真實反饋,專門優化模型的某些能力。
優化完了,元寶團隊馬上拿去測試,發現新問題,再繼續調整。
這個過程是雙向并且同步的。產品給模型提供真實數據和反饋,模型給產品提供更強的能力。
為什么這么做有用?因為 LLM 時代和過去的AI最本質的區別就是泛化性。
在LLM之前,做翻譯產品只需要把翻譯數據做好,做圍棋程序只需要把圍棋數據準備好。
但今天情況不一樣了,哪怕你只是想做一個Coding Agent,你也得要模型有聊天能力、搜索能力、指令遵循能力、推理能力。所以最終,它就變成了一個非常復雜的交叉學科問題。
騰訊和元寶的Co-Design,就是為了讓混元模型產生很強的聊天和搜索能力。這樣的能力又可以被遷移到 ima、WorkBuddy 等其他產品。一個產品訓練出來的能力,可以讓其他產品也變得更好用。
具體來說,元寶處理的是真實世界的Prompt distribution。用戶在元寶里問的問題都是比較模糊的,可能就一兩句話,會不停追問。
這些場景訓練出來的多輪對話能力、意圖理解能力,可以直接遷移到微信AI處理群聊任務時的上下文理解。
WorkBuddy積累的是辦公協作場景的數據。
它理解文檔結構、會議紀要、任務分配這些企業場景的語義。這些能力可以讓微信AI在處理任務時,知道如何提取關鍵信息、識別決策節點。
ima沉淀的是搜索能力。它訓練模型如何把模糊的查詢意圖轉化為精確的搜索策略,如何從海量的結果當中,去篩選有效的信息。這些能力可以讓微信AI在調用小程序前,先做一輪信息篩選和意圖澄清,這樣微信AI在調用的時候,就不會把可能的小程序都調用一遍進而浪費時間和token,而是會只調用少數用得上的小程序。
Marvis訓練的是任務拆解和工具調度能力。
Marvis把用戶的指令,拆解成多個子任務,調度不同的Agent去操控文件、系統、應用。這套任務編排和多Agent協同的能力,可以讓微信AI在面對“幫我訂咖啡然后通知同事”這類跨場景任務時,知道如何串聯小程序調用、支付流程和消息通知。
這些產品提供不同的數據,但這些數據之間可以相互擴散、相互遷移,形成一個像網絡一樣的體系。一個產品訓練出來的數據,可以通過預訓練和后訓練的泛化機制,提升另一個產品的表現。
微信AI現在正在一個AI的網絡中心。
它不需要從零開始,它可以直接調用這些已經被驗證過的能力。
更重要的是,微信本身就是一個完整的生態。有關系鏈、有小程序、有微信支付的交易閉環、還有公眾號和視頻號的內容生態。這些都是其他Agent產品沒有的。
03
微信AI的舞臺有多大?
這一切的一切,目前都由A2A來實現。
A2A全稱是 Agent-to-Agent,中文叫“智能體到智能體”。
它是一個開放協議,規定不同廠商的AI智能體之間如何通信、如何調用能力、如何保障安全。與之對應的是 GUIAgent路線,也就是讓AI像人一樣通過“讀屏”來識別界面,再通過“模擬點擊”去操作微信。
騰訊選擇A2A,而不是GUI,這個決策背后其實是有深度考量的。
5月的騰訊 Q1財報電話會上,有分析師問騰訊總裁劉熾平,“如何看待來自操作系統層面智能體的長期潛力或潛在顛覆,包括來自 iOS、Android 或手機廠商的智能體”。
劉熾平回答說,“從操作系統的角度來看,這里面混了幾種不同的東西。有真正的操作系統,如 iOS 和 Android,然后還有那些試圖假裝自己是操作系統的應用程序。如果你是 iOS 或 Android 這樣的操作系統,你希望確保生態系統得到良好保護和精心策劃,并給予應用程序合理的權限,你可以擁有一個試圖為用戶提供服務的智能體,但你需要獲得不同應用程序的許可。否則,作為操作系統,你本質上是在掠奪不同的應用程序,這不是管理操作系統的最佳方式。”
劉熾平的意思是,用操作系統的Agent來操控應用是可以的,但不能不獲得應用程序的授權,否則就是對應用的掠奪。
用更直白一點的話來說,騰訊不接受GUI agent,只接受A2A。
過去兩年,手機廠商曾嘗試用GUI來從外部打通微信。
榮耀YOYO宣傳過“一句話發微信紅包”,小米智能家居產品的賣點是“小愛自動打通微信電話”。當你對手機說“給 XX 發個10塊錢紅包”時,AI助手在后臺執行的是:解鎖、點擊微信圖標、搜索 XX、點擊加號、點擊紅包、輸入10、調起支付。
這一行為很快被微信封殺。
2025年4月,微信安全中心發布公告,禁止第三方工具繞過微信安全技術措施,違法違規獲取或利用微信終端用戶數據。
字節的豆包手機也遭遇同樣命運。
2025年12月,豆包手機助手技術預覽版發布,核心賣點是“AI 直接跨應用操作”。很快,大量用戶反饋微信賬號被強制下線,系統提示登錄環境異常。騰訊方面表示,這觸發了微信既有的安全風控策略。
在微信AI上,榮耀是第一個完成微信A2A適配的品牌。目前榮耀部分機型已經支持該功能,用戶可以喚醒 YOYO 直接語音下達指令,比如語音發微信消息、撥打微信語音、視頻通話。
一位騰訊內部人士評價稱,任何手機 agent,如果不能調用微信,就不算一個真正的系統級 Agent。騰訊這個口子一定會開,只是時間問題。
微信愿意通過A2A這類受控協議,讓手機廠商Agent有限調用微信能力,但不會放任外部Agent靠讀屏、模擬點擊進入微信。
這說明歸根結底,騰訊還是要掌握微信生態的調用權和規則制定權。
說到豆包,這里就引出了另一個問題,微信AI會收費嗎?
豆包月活3.45億,最近都傳出要開始對一些功能進行收費,微信14億月活,壓力只會更大。
更何況,微信AI要面對這么多人,每個場景都觸發推理,成本一定是天文數字。
此前騰訊擬投資DeepSeek的這100億,就可以解釋為模型供給和成本底座。
騰訊自研的混元大模型需要技術盟友,微信生態更需要低成本推理能力。DeepSeek 的低成本訓練路線,恰好符合微信AI這種海量用戶場景的需求。
6月2日,騰訊還宣布,騰訊云平臺上的DeepSeek-V4系列調用價格全面持平 DeepSeek 官方售價,用戶無需承擔任何云平臺溢價。
這一切線索都在暗示,騰訊要和 DeepSeek 深度綁定,而微信 Agent,很可能就是綁定后的第一份答案。
基礎任務用小模型,成本低、速度快。復雜任務調用強模型,效果好、準確率高。這種多模型調度的能力,既要保證效果,又要控制成本。
作為一名微信的用戶,如果微信AI能夠真正做到一次把任務做成,我是愿意為這個能力付費的。
比如幫我訂一張機票,幫我找一家餐廳,以及幫我想起這個在我朋友圈列表里躺了好久,我還和他沒有任何聊天記錄的人是誰。我覺得這些功能都很有價值。
更重要的是,微信AI面對的不只是個人用戶,還有企業用戶。企業自動化、智能客服、智能營銷,這些場景對AI的需求更強,付費意愿也更高。
微信AI的舞臺其實很大。具體有多大呢?答案是,微信生態有多大,微信AI的舞臺就有多大。
騰訊首席AI科學家、混元大模型負責人姚順雨在6月5日的騰訊云AI產業應用大會上,給出了一個更長遠的判斷。
他認為,AI是一個長期游戲,而非短期窗口。他批評了硅谷部分從業者“趕快賺兩年錢退休”的心態,強調當前就像“70年代的PC”,未來將不斷涌現新的產品機會。
這個判斷,恰恰解釋了騰訊為什么愿意在微信 AI 上投入如此大的成本。姚順雨特別強調,“實用性價值大于刷榜價值”。他認為,AI 方法論已經高度成熟,真正的難點在于尋找“好問題”去解決,而不是追求排行榜上的數字。
微信AI要解決的,正是這樣的“好問題”。
如何讓這14億的用戶,在日常生活中感受到AI帶來的價值。?
這里沒有炫技,更沒有刷榜,只有解決了這個好問題,騰訊才算真正進入了AI的下半場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.