網易首頁 > 網易號 > 正文申請入駐

微信agent發出“英雄令”，互聯網半壁江山響應

2026-06-09 12:33:00　來源: 字母榜

北京舉報

分享至

微信Agent真的要來了。

微信開放平臺發布了這樣一條關于微信AI開發者指引的內容。

指引稱，為給用戶提供更智能的交互體驗，幫助用戶更敏捷地發現并使用小程序服務，微信開放平臺在充分尊重開發者權益和自主選擇的基礎上，為開發者提供便捷接入微信AI生態的能力。

接入后，小程序將有機會被微信AI推薦和調用。未完成接入的小程序，將無法被微信AI調用。

平臺提供了兩種接入模式。自動模式，授權平臺提審時讀取小程序源碼，無需投入額外開發。開發模式，開發者可基于小程序業務特性，自主個性化開發。

同一天，美團官宣率先接入微信AI生態。作為首批內測團隊，美團此前已與微信團隊聯合開發并測試接入。未來，用戶可通過微信AI調用美團外賣等本地生活服務。

攜程、同程等生活服務平臺也先后宣布接入微信。

早在幾天前，騰訊客服就表示，微信正在與華為、小米、榮耀、OPPO、vivo 等手機廠商合作推出A2A助手能力，目前已有多家廠商完成接入。

用戶可以通過對應手機系統的AI助手發起微信音視頻通話或向指定好友發送消息。

這其實不是第一次有關微信AI的消息了。早在今年3月，就有外媒表示，騰訊在微信內部推進一項高度保密的AI Agent項目。

6月2日，外媒發布消息稱，騰訊正在測試微信內置AI Agent原型，最快將于本月啟動合規審批流程。報道發布當天，騰訊股價收盤上漲10.5%，單日市值增加超過3000億港元，創下自2021年1月以來最大單日漲幅。

微信AI，或許就是騰訊AI下半場的終極答案。

微信AI的輪廓

看過早期演示的人士透露，用戶可以在微信主界面向右滑動，調出AI Agent的對話窗口。用戶輸入指令后，Agent會自動調用微信生態里的小程序，完成篩選、下單、預訂這類任務。

比如你說“幫我點一杯30元以內、不太甜、附近能自取的咖啡”，Agent就會自動調用微信里的小程序，幫你篩選咖啡店、匹配口味和價格，甚至完成下單流程。

光聽描述，它和豆包、千問這些AI聊天機器人沒什么區別。

但這里面特殊的地方在于，微信AI擁有整個微信生態的調度權。

騰訊在2025年年報中明確提到，目標是在微信生態內建設下一代Agentic services，把小程序、內容、社交和支付能力連接起來。截至2026年3月31日，微信及 WeChat 合并月活達14.32億。

也就是說，微信AI一旦上線，不管是好是壞，它都注定是一個超級應用。

微信里有數百萬個小程序，覆蓋打車、外賣、訂票、買菜等日常生活場景。國內頭部互聯網服務幾乎都在這一生態中設有小程序入口。

微信AI的核心能力，就是讓AI能夠調用這些小程序里的服務和交易能力，完成從認知到決策再到執行的完整閉環。

那它要怎么做呢？

首先是理解用戶意圖。用戶說“幫我訂個餐廳”，在家庭群里說和在工作群里說，意思完全不同。

誰在參與、誰能拍板、預算多少、有什么忌口、任務進行到了哪一步，這些都是Agent需要理解的上下文。難點在于微信里的任務天然跨越時間，家庭群討論暑假的對話可能斷斷續續持續好幾天。

然后是調用工具。

Agent需要動手，用搜一搜查信息，用小程序完成查詢和比價，用微信支付完成交易，用服務通知把結果反饋給用戶。

根據QuestMobile《2026全景生態流量春季報告》，小程序日活已超過9億，覆蓋幾百個細分領域。

現在工具箱足夠大了，問題是微信AI用得明白嗎？

騰訊在3月18日發布的論文中透露了一些技術細節。微信團隊開發了 UI-Oceanus，這是一個專門為小程序生態設計的世界模型。它的作用是預測操作結果。Agent找到了按鈕，但點下去會發生什么？頁面會跳轉到哪里？會彈出什么窗口？支付流程會不會啟動？

人類操作APP的時候對這些有直覺，Agent沒有這種直覺，所以它必須得從數據里學。

游戲AI學的是“按下這個鍵角色會怎么動”，小程序的世界模型學的是“點這個按鈕頁面會怎么變”。

直接在真實小程序環境里訓練太慢、太不穩定，所以 UI-Oceanus 自動模擬操作和頁面變化，生成了500萬樣本。這讓Agent可以在虛擬環境里學會操作小程序，然后再遷移到真實場景。

還有成本問題。14億月活的入口如果每個場景都觸發推理，成本是天文數字。騰訊需要在基礎任務用小模型，復雜任務調用強模型之間做平衡。這種多模型調度的能力，既要保證效果，又要控制成本。

最后是生態協調。

微信里的小程序太多了，服務質量、接口穩定性、商家配合度、支付流程、推薦排序、利益分配，每一項單拎出來都可以講很久。

AI Agent要替用戶辦事，就得真的辦成，不能嘴上答應得特別絲滑，結果點單點到半路開始迷路。

所以微信AI其實是一個非常復雜的工程，它要面對各種各樣的復雜場景。它還需要理解自然語言，需要調用小程序，需要處理支付，需要管理上下文，需要協調生態。

微信AI的輪廓清晰，只不過這個產品會比我們想象中要大得多。

為什么微信最適合承接這個 Agent

上下文越豐富，AI就越能理解你的真實意圖，做出的決策也就越準確。

而微信剛好是騰訊最大的上下文容器。

微信有關系鏈，14億用戶在微信里的社交關系、聊天記錄、群組對話，這些都是上下文。微信有小程序，數百萬個小程序覆蓋的服務場景，這些也是上下文。

微信有支付，用戶的消費習慣、支付記錄、交易偏好，這些還是上下文。

微信有內容，公眾號、視頻號、朋友圈里的信息流，這些同樣是上下文。

前一陣，騰訊推出了很多AI產品，比如元寶、ima、WorkBuddy、Marvis，他們看似相互獨立。實際上，它們都是在為微信AI積累能力。

這背后是騰訊內部一套叫做Co-Design的機制。

簡單來說，Co-Design就是產品團隊和模型團隊一起設計、一起優化。

傳統做法是，模型團隊先把模型訓練好，然后扔給產品團隊去用。產品團隊發現問題了，再反饋回來，模型團隊再調整。

這個過程很慢，而且經常出現“模型很強但產品不好用”的情況。

Co-Design的做法不一樣。元寶團隊會告訴混元團隊，用戶在真實場景里到底怎么提問、會遇到什么問題。混元團隊會根據這些真實反饋，專門優化模型的某些能力。

優化完了，元寶團隊馬上拿去測試，發現新問題，再繼續調整。

這個過程是雙向并且同步的。產品給模型提供真實數據和反饋，模型給產品提供更強的能力。

為什么這么做有用？因為 LLM 時代和過去的AI最本質的區別就是泛化性。

在LLM之前，做翻譯產品只需要把翻譯數據做好，做圍棋程序只需要把圍棋數據準備好。

但今天情況不一樣了，哪怕你只是想做一個Coding Agent，你也得要模型有聊天能力、搜索能力、指令遵循能力、推理能力。所以最終，它就變成了一個非常復雜的交叉學科問題。

騰訊和元寶的Co-Design，就是為了讓混元模型產生很強的聊天和搜索能力。這樣的能力又可以被遷移到 ima、WorkBuddy 等其他產品。一個產品訓練出來的能力，可以讓其他產品也變得更好用。

具體來說，元寶處理的是真實世界的Prompt distribution。用戶在元寶里問的問題都是比較模糊的，可能就一兩句話，會不停追問。

這些場景訓練出來的多輪對話能力、意圖理解能力，可以直接遷移到微信AI處理群聊任務時的上下文理解。

WorkBuddy積累的是辦公協作場景的數據。

它理解文檔結構、會議紀要、任務分配這些企業場景的語義。這些能力可以讓微信AI在處理任務時，知道如何提取關鍵信息、識別決策節點。

ima沉淀的是搜索能力。它訓練模型如何把模糊的查詢意圖轉化為精確的搜索策略，如何從海量的結果當中，去篩選有效的信息。這些能力可以讓微信AI在調用小程序前，先做一輪信息篩選和意圖澄清，這樣微信AI在調用的時候，就不會把可能的小程序都調用一遍進而浪費時間和token，而是會只調用少數用得上的小程序。

Marvis訓練的是任務拆解和工具調度能力。

Marvis把用戶的指令，拆解成多個子任務，調度不同的Agent去操控文件、系統、應用。這套任務編排和多Agent協同的能力，可以讓微信AI在面對“幫我訂咖啡然后通知同事”這類跨場景任務時，知道如何串聯小程序調用、支付流程和消息通知。

這些產品提供不同的數據，但這些數據之間可以相互擴散、相互遷移，形成一個像網絡一樣的體系。一個產品訓練出來的數據，可以通過預訓練和后訓練的泛化機制，提升另一個產品的表現。

微信AI現在正在一個AI的網絡中心。

它不需要從零開始，它可以直接調用這些已經被驗證過的能力。

更重要的是，微信本身就是一個完整的生態。有關系鏈、有小程序、有微信支付的交易閉環、還有公眾號和視頻號的內容生態。這些都是其他Agent產品沒有的。

微信AI的舞臺有多大？

這一切的一切，目前都由A2A來實現。

A2A全稱是 Agent-to-Agent，中文叫“智能體到智能體”。

它是一個開放協議，規定不同廠商的AI智能體之間如何通信、如何調用能力、如何保障安全。與之對應的是 GUIAgent路線，也就是讓AI像人一樣通過“讀屏”來識別界面，再通過“模擬點擊”去操作微信。

騰訊選擇A2A，而不是GUI，這個決策背后其實是有深度考量的。

5月的騰訊 Q1財報電話會上，有分析師問騰訊總裁劉熾平，“如何看待來自操作系統層面智能體的長期潛力或潛在顛覆，包括來自 iOS、Android 或手機廠商的智能體”。

劉熾平回答說，“從操作系統的角度來看，這里面混了幾種不同的東西。有真正的操作系統，如 iOS 和 Android，然后還有那些試圖假裝自己是操作系統的應用程序。如果你是 iOS 或 Android 這樣的操作系統，你希望確保生態系統得到良好保護和精心策劃，并給予應用程序合理的權限，你可以擁有一個試圖為用戶提供服務的智能體，但你需要獲得不同應用程序的許可。否則，作為操作系統，你本質上是在掠奪不同的應用程序，這不是管理操作系統的最佳方式。”

劉熾平的意思是，用操作系統的Agent來操控應用是可以的，但不能不獲得應用程序的授權，否則就是對應用的掠奪。

用更直白一點的話來說，騰訊不接受GUI agent，只接受A2A。

過去兩年，手機廠商曾嘗試用GUI來從外部打通微信。

榮耀YOYO宣傳過“一句話發微信紅包”，小米智能家居產品的賣點是“小愛自動打通微信電話”。當你對手機說“給 XX 發個10塊錢紅包”時，AI助手在后臺執行的是：解鎖、點擊微信圖標、搜索 XX、點擊加號、點擊紅包、輸入10、調起支付。

這一行為很快被微信封殺。

2025年4月，微信安全中心發布公告，禁止第三方工具繞過微信安全技術措施，違法違規獲取或利用微信終端用戶數據。

字節的豆包手機也遭遇同樣命運。

2025年12月，豆包手機助手技術預覽版發布，核心賣點是“AI 直接跨應用操作”。很快，大量用戶反饋微信賬號被強制下線，系統提示登錄環境異常。騰訊方面表示，這觸發了微信既有的安全風控策略。

在微信AI上，榮耀是第一個完成微信A2A適配的品牌。目前榮耀部分機型已經支持該功能，用戶可以喚醒 YOYO 直接語音下達指令，比如語音發微信消息、撥打微信語音、視頻通話。

一位騰訊內部人士評價稱，任何手機 agent，如果不能調用微信，就不算一個真正的系統級 Agent。騰訊這個口子一定會開，只是時間問題。

微信愿意通過A2A這類受控協議，讓手機廠商Agent有限調用微信能力，但不會放任外部Agent靠讀屏、模擬點擊進入微信。

這說明歸根結底，騰訊還是要掌握微信生態的調用權和規則制定權。

說到豆包，這里就引出了另一個問題，微信AI會收費嗎？

豆包月活3.45億，最近都傳出要開始對一些功能進行收費，微信14億月活，壓力只會更大。

更何況，微信AI要面對這么多人，每個場景都觸發推理，成本一定是天文數字。

此前騰訊擬投資DeepSeek的這100億，就可以解釋為模型供給和成本底座。

騰訊自研的混元大模型需要技術盟友，微信生態更需要低成本推理能力。DeepSeek 的低成本訓練路線，恰好符合微信AI這種海量用戶場景的需求。

6月2日，騰訊還宣布，騰訊云平臺上的DeepSeek-V4系列調用價格全面持平 DeepSeek 官方售價，用戶無需承擔任何云平臺溢價。

這一切線索都在暗示，騰訊要和 DeepSeek 深度綁定，而微信 Agent，很可能就是綁定后的第一份答案。

基礎任務用小模型，成本低、速度快。復雜任務調用強模型，效果好、準確率高。這種多模型調度的能力，既要保證效果，又要控制成本。

作為一名微信的用戶，如果微信AI能夠真正做到一次把任務做成，我是愿意為這個能力付費的。

比如幫我訂一張機票，幫我找一家餐廳，以及幫我想起這個在我朋友圈列表里躺了好久，我還和他沒有任何聊天記錄的人是誰。我覺得這些功能都很有價值。

更重要的是，微信AI面對的不只是個人用戶，還有企業用戶。企業自動化、智能客服、智能營銷，這些場景對AI的需求更強，付費意愿也更高。

微信AI的舞臺其實很大。具體有多大呢？答案是，微信生態有多大，微信AI的舞臺就有多大。

騰訊首席AI科學家、混元大模型負責人姚順雨在6月5日的騰訊云AI產業應用大會上，給出了一個更長遠的判斷。

他認為，AI是一個長期游戲，而非短期窗口。他批評了硅谷部分從業者“趕快賺兩年錢退休”的心態，強調當前就像“70年代的PC”，未來將不斷涌現新的產品機會。

這個判斷，恰恰解釋了騰訊為什么愿意在微信 AI 上投入如此大的成本。姚順雨特別強調，“實用性價值大于刷榜價值”。他認為，AI 方法論已經高度成熟，真正的難點在于尋找“好問題”去解決，而不是追求排行榜上的數字。

微信AI要解決的，正是這樣的“好問題”。

如何讓這14億的用戶，在日常生活中感受到AI帶來的價值。？

這里沒有炫技，更沒有刷榜，只有解決了這個好問題，騰訊才算真正進入了AI的下半場。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.