編輯部 整理自 AIGC2026
量子位 | 公眾號(hào) QbitAI
當(dāng)全民都在“養(yǎng)龍蝦”的時(shí)候,真正的問(wèn)題才剛開(kāi)始浮現(xiàn)。
在剛剛結(jié)束的2026中國(guó)AIGC產(chǎn)業(yè)峰會(huì)上,亞馬遜云科技產(chǎn)品技術(shù)部技術(shù)總監(jiān)王曉野帶來(lái)了一組直觀數(shù)據(jù):
87%的企業(yè)宣稱已經(jīng)大規(guī)模部署了AI,而真正從中獲得價(jià)值的,只有10%。
很顯然,Demo從來(lái)都不難做,難的是讓它在企業(yè)生產(chǎn)環(huán)境里真正跑起來(lái)。
![]()
在他看來(lái),個(gè)人在Mac mini上跑一個(gè)好玩的Agent、隨時(shí)可以拔電源重啟,和讓幾千個(gè)Agent在企業(yè)分布式環(huán)境里安全、可信、不中斷地穩(wěn)定運(yùn)行,完全是兩個(gè)維度的工程復(fù)雜度。
這場(chǎng)分享還用最硬核的工程視角直擊了企業(yè)痛點(diǎn)——
別再指望靠一個(gè)模型去搞定所有事了。
算力夠不夠劃算、數(shù)據(jù)安不安全、Agent會(huì)不會(huì)玩失憶或記憶串臺(tái)……從底層基礎(chǔ)設(shè)施到上層應(yīng)用,每一層都是必須硬啃的真問(wèn)題。
為了完整體現(xiàn)王曉野的思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)演講內(nèi)容進(jìn)行了編輯整理,希望能給你帶來(lái)更多啟發(fā)。
2026中國(guó)AIGC產(chǎn)業(yè)峰會(huì)是由量子位主辦的行業(yè)峰會(huì),近20位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾超千人,線上直播觀眾近400萬(wàn),獲得了主流媒體的廣泛關(guān)注與報(bào)道。
核心觀點(diǎn)梳理
- 87%的企業(yè)實(shí)現(xiàn)了AI大規(guī)模部署,但真正從中獲得生產(chǎn)價(jià)值的比例只有10%。
- 個(gè)人養(yǎng)龍蝦和企業(yè)養(yǎng)龍蝦,完全是兩碼事。
- AI真的不只是大模型,拿掉模型后剩下的Harness才是關(guān)鍵。
- 過(guò)去的數(shù)據(jù)平臺(tái)是服務(wù)人的,今天的數(shù)據(jù)平臺(tái)必須服務(wù)好AI Agent。
- 過(guò)去30年個(gè)人生產(chǎn)力從未被真正顛覆,直到Working Agent出現(xiàn)。
- Token貴,很多時(shí)候是因?yàn)槟阄菇o模型的信息太多太雜,而非單價(jià)貴。
以下為王曉野演講原文:
企業(yè)級(jí)Agent落地的四大鴻溝與落地體感
大家上午好!非常感謝量子位的邀請(qǐng)。
我今天演講的主題叫《跨越Agent落地鴻溝:從模型到企業(yè)級(jí)AI Agent落地》。
跟前面幾位嘉賓分享的方式不太一樣,我會(huì)直白一些,也會(huì)通過(guò)一系列產(chǎn)品和案例,跟大家分享我們對(duì)企業(yè)級(jí)Agent落地的思考。
作為一家長(zhǎng)期服務(wù)全球客戶的科技企業(yè),亞馬遜云科技一直在通過(guò)云服務(wù)支持?jǐn)?shù)百萬(wàn)企業(yè)客戶,今天我也想借由我們產(chǎn)品更新背后的思路,跟大家聊聊:真正把Agent落到企業(yè)生產(chǎn)環(huán)境時(shí),企業(yè)需要回答哪些問(wèn)題。
![]()
過(guò)去幾年,無(wú)論是Agent產(chǎn)品,還是Agent構(gòu)建框架,都可以說(shuō)層出不窮。
但真正能夠在生產(chǎn)環(huán)境里大規(guī)模、穩(wěn)定運(yùn)行的Agent,其實(shí)寥寥無(wú)幾。這里面到底存在怎樣的差距?
接下來(lái)我會(huì)結(jié)合亞馬遜云科技跟客戶一起實(shí)踐、總結(jié)出來(lái)的經(jīng)驗(yàn),通過(guò)一些產(chǎn)品能力更新,來(lái)分享我們的答案。
我們先快速看一下AI現(xiàn)在的大趨勢(shì)。
過(guò)去我們經(jīng)常會(huì)先跟客戶聊AI應(yīng)用的use case,也就是它到底能用在什么場(chǎng)景。
但相信很多細(xì)分場(chǎng)景大家已經(jīng)很熟悉了,如果往大的方向總結(jié),大致可以看到幾個(gè)方向。
第一類是AI生成音頻、視頻、音樂(lè),這些方向已經(jīng)走得非常前沿,大家每天都能感受到日新月異的變化。
第二類是基礎(chǔ)模型,從語(yǔ)言模型開(kāi)始,大家真正感受到了AI的力量,同時(shí)也意識(shí)到這件事可能還有一段路要走。
第三類是具身智能。
我們從具身智能企業(yè)的變化中可以看到,去年大家還更多關(guān)注動(dòng)態(tài)控制,今年已經(jīng)明顯轉(zhuǎn)向——如何收集數(shù)據(jù),如何跟物理世界形成感知,再形成行動(dòng)反饋。
還有一個(gè)更火、也可以說(shuō)離成熟更接近的方向就是Agent。
今天我會(huì)聚焦在Agent這個(gè)話題上,因?yàn)樗x企業(yè)真正落地更近。從落地的角度來(lái)看,Agent是當(dāng)前最值得重點(diǎn)討論的方向。
相信很多嘉賓都反復(fù)提到了養(yǎng)龍蝦在中國(guó)已經(jīng)成為一個(gè)非常火熱的話題,很多個(gè)人用戶都在嘗試,全民都在養(yǎng)龍蝦,甚至有新聞提到深圳的工程師會(huì)幫個(gè)人用戶安裝、配置這些工具。
但個(gè)人養(yǎng)龍蝦和企業(yè)養(yǎng)龍蝦是兩件事。
個(gè)人環(huán)境里,配置好之后可能很少需要再去改動(dòng);但在企業(yè)環(huán)境里,你能不能讓幾千個(gè)Agent在企業(yè)環(huán)境中安全、可信地運(yùn)行起來(lái)?背后其實(shí)有不少鴻溝需要跨越。
首先是模型選擇和響應(yīng)速度。
企業(yè)出于性價(jià)比考慮,也因?yàn)槟P湍芰γ刻於荚诳焖僮兓孕枰皶r(shí)響應(yīng)模型變化,并且能夠在多個(gè)模型之間靈活選擇。
第二是構(gòu)建復(fù)雜度。
云時(shí)代我們都知道,一個(gè)分布式系統(tǒng)要長(zhǎng)期穩(wěn)定運(yùn)行,本身就是非常困難的事情。
一個(gè)能跑在Mac mini上的龍蝦,個(gè)人用戶可以隨時(shí)拔電源、重啟;但到了企業(yè)生產(chǎn)級(jí)場(chǎng)景,它能否可靠、穩(wěn)定地運(yùn)行,能否自動(dòng)重啟且不中斷,能否可信地處理數(shù)據(jù),就完全是另一層工程復(fù)雜度。
第三是使用門檻。
無(wú)論是Hermes,還是龍蝦,還是其他自主性Agent,對(duì)工程師來(lái)說(shuō),使用門檻已經(jīng)比過(guò)去傳統(tǒng)IT系統(tǒng)低很多。
但對(duì)于業(yè)務(wù)人員來(lái)說(shuō),比如營(yíng)銷、HR等崗位,他們能否真正把這些工具用起來(lái),依然存在門檻。
第四是人才gap。
前面提到的很多問(wèn)題,最終都需要人來(lái)解決,需要企業(yè)里的平臺(tái)部門把AI能力賦能給整個(gè)組織。
但今天具備端到端推動(dòng)Agent落地能力的人才,依然有很大缺口。
三個(gè)禮拜前,在亞馬遜云科技全球發(fā)布中,亞馬遜云科技CEO Matt Garman也分享了幾個(gè)觀點(diǎn)。
第一,他認(rèn)為AI和Agent帶來(lái)了極大的市場(chǎng)構(gòu)建范式變化,很多應(yīng)用都應(yīng)該被重新改造一次。
這句話聽(tīng)起來(lái)可能很熟悉,但今天再看,味道已經(jīng)跟過(guò)去不一樣了。
過(guò)去我們更多是在暢想未來(lái),但今天我們是基于已經(jīng)看到的事實(shí),基于企業(yè)里已經(jīng)落地的東西,來(lái)表達(dá)這樣的觀點(diǎn)。
Matt還有一句話,我個(gè)人也非常認(rèn)同。他認(rèn)為,過(guò)去30年里,個(gè)人生產(chǎn)力其實(shí)從來(lái)沒(méi)有被真正大規(guī)模顛覆過(guò)。
大家回想一下,無(wú)論是使用Office,還是使用各類通信軟件,軟件本身一直在迭代,但我們的工作方式并沒(méi)有發(fā)生太大的變化。
但今天Agent的出現(xiàn),尤其是大家使用龍蝦后的體感,會(huì)讓人明顯感受到:我們確實(shí)走到了一個(gè)節(jié)點(diǎn),個(gè)人的工作方式正在發(fā)生變化。
在講趨勢(shì)之前,我們先用幾組數(shù)據(jù)找一下感覺(jué)。
Gartner的分析顯示,從2028年到2030年,會(huì)有超過(guò)15%的企業(yè)日常工作決策由Agent或AI自主完成。
這里說(shuō)的不是人輔助決策,而是由Agent完全自主地完成決策,也不只是幫人執(zhí)行任務(wù)。
一些關(guān)于勞動(dòng)力的研究報(bào)告也提到,在2026年到2028年期間,82%的企業(yè)領(lǐng)導(dǎo)者表示會(huì)增加雇用“數(shù)字員工”的比例,為企業(yè)服務(wù),而不只是招聘人類員工。
麥肯錫的分析則顯示,Agent以及生成式AI帶來(lái)的增量商業(yè)市場(chǎng)規(guī)模,可能從2.6萬(wàn)億美元增長(zhǎng)到4.4萬(wàn)億美元,接近翻倍。
那這是不是炒作?
我們?cè)倏匆恍?shí)際企業(yè)通過(guò)調(diào)研反饋回來(lái)的數(shù)據(jù)。
同樣是麥肯錫的報(bào)告提到,今天已經(jīng)有87%的企業(yè)宣稱實(shí)現(xiàn)了AI在公司里的大規(guī)模生產(chǎn)部署,而一年前這個(gè)數(shù)字還是78%,進(jìn)展非常快。
同時(shí),德勤的一些報(bào)告也反饋,真正把AI用到生產(chǎn)系統(tǒng)的企業(yè)中,確實(shí)有一部分企業(yè)反映生產(chǎn)力獲得了收益。
這些信號(hào)聽(tīng)起來(lái)可能有些矛盾,但本質(zhì)上都在說(shuō)明同一件事:今天AI Agent在企業(yè)層面的滲透率已經(jīng)很高,但真正獲得價(jià)值、走到生產(chǎn)層面的比例仍然有限。麥肯錫同一份報(bào)告里也提到,這個(gè)比例可能只有10%左右。
![]()
像龍蝦這樣的Agent,讓我們看到了河對(duì)岸長(zhǎng)什么樣。但企業(yè)要真正走到生產(chǎn)落地,中間還需要一座橋。
今天我想通過(guò)一些產(chǎn)品能力更新,來(lái)跟大家分享這座橋應(yīng)該長(zhǎng)什么樣。
從Demo走向生產(chǎn)的那座橋
簡(jiǎn)單來(lái)說(shuō),亞馬遜云科技認(rèn)為,企業(yè)IT平臺(tái)和企業(yè)技術(shù)決策者真正推動(dòng)Agent從Demo走向生產(chǎn)時(shí),需要關(guān)注五大能力。
第一層是AI Agent所需的算力。
如果回到Agent這個(gè)話題,算力可能更強(qiáng)調(diào)推理部分。過(guò)去我們更多討論訓(xùn)練算力,但Agent場(chǎng)景對(duì)推理算力的需求會(huì)更加突出。
第二層是模型。
企業(yè)需要能夠快速獲取行業(yè)前沿模型,或者是最適合自身場(chǎng)景的模型,同時(shí)還要具備很高的性價(jià)比。
第三層是數(shù)據(jù)和知識(shí)。
Agent雖然把回答問(wèn)題轉(zhuǎn)變成了行動(dòng)能力,但就像炒菜一樣,如果沒(méi)有企業(yè)知識(shí)這類“獨(dú)家配方”,它永遠(yuǎn)只能做出西紅柿炒雞蛋這類大眾化動(dòng)作,真正進(jìn)入企業(yè)流程時(shí),Agent需要的是企業(yè)自己的數(shù)據(jù)和知識(shí)。
第四層是Agentic平臺(tái)。
今天大家已經(jīng)越來(lái)越清楚,AI不只是模型能力,Harness也至關(guān)重要。
第五層是Agent應(yīng)用。
并不是所有事情都需要企業(yè)自己構(gòu)建,很多通用能力已經(jīng)可以通過(guò)垂直、專用或通用Agent應(yīng)用的形態(tài)直接采購(gòu)和使用。
接下來(lái)我會(huì)按照這五層展開(kāi),分享我們?cè)诋a(chǎn)品設(shè)計(jì)理念上如何思考這些問(wèn)題。
先看AI基礎(chǔ)設(shè)施這一層。今天我們?nèi)匀辉谟懻揟oken消耗量、討論延遲,背后的潛臺(tái)詞是什么?
就是企業(yè)在性價(jià)比上還沒(méi)有達(dá)到可以隨意使用的狀態(tài)。這有點(diǎn)像早年大家會(huì)計(jì)算一條短信多少錢,而不是像今天發(fā)微信一樣,完全不需要考慮成本。
所以最底層能夠幫助企業(yè)降本增效的能力,應(yīng)該來(lái)自算力層的大量?jī)?yōu)化。
亞馬遜云科技的優(yōu)勢(shì)來(lái)自20多年服務(wù)云客戶的經(jīng)驗(yàn)。我們服務(wù)了幾百萬(wàn)客戶,也知道客戶在云上跑什么樣的負(fù)載。
即使是推理,我們也會(huì)關(guān)注這個(gè)Agent是更多以規(guī)劃為主,還是以執(zhí)行簡(jiǎn)單任務(wù)為主,或者更傾向于Workflow。
針對(duì)這些不同負(fù)載,大家其實(shí)會(huì)有一個(gè)共識(shí):
通用芯片無(wú)法在所有場(chǎng)景中都提供最好的性價(jià)比。
亞馬遜云科技從十幾年前就開(kāi)始自研芯片,把一些虛擬化技術(shù)通過(guò)硬件能力實(shí)現(xiàn);之后又推出基于Arm的CPU計(jì)算Graviton,目前已經(jīng)走到第五代;再到專用AI芯片Trainium,也已經(jīng)走到第三代。
簡(jiǎn)單來(lái)說(shuō),在計(jì)算這一層,我們認(rèn)為客戶應(yīng)該享受到面向具體場(chǎng)景的最優(yōu)性價(jià)比計(jì)算能力。
模型這一層,我們秉承的觀點(diǎn)很多年來(lái)都沒(méi)有變:
客戶和企業(yè)需要的是選擇,而不是被綁定在一個(gè)模型上。
Amazon Bedrock也是通過(guò)不斷擴(kuò)大模型能力來(lái)支持這一點(diǎn)。包括中國(guó)一些優(yōu)秀模型,比如智譜GLM、MiniMax的模型,我們都在積極推進(jìn)上架到Bedrock平臺(tái)。
![]()
當(dāng)然,在企業(yè)語(yǔ)境下,Bedrock除了提供平臺(tái)能力,更重要的是提供企業(yè)數(shù)據(jù)保護(hù)和隱私保護(hù)。
整個(gè)平臺(tái)基于20多年云計(jì)算積累下來(lái)的信任能力,企業(yè)可以通過(guò)云上的VPC等技術(shù),保證自己的數(shù)據(jù)不會(huì)被中間的一些路由工具截取或獲得。
數(shù)據(jù)和知識(shí)這一層,我們認(rèn)為今天需要看到一個(gè)變化:傳統(tǒng)的數(shù)據(jù)平臺(tái)、數(shù)據(jù)底座或數(shù)據(jù)基石,過(guò)去主要是服務(wù)于人的;但今天,企業(yè)平臺(tái)部門和技術(shù)部門需要關(guān)注的是,數(shù)據(jù)平臺(tái)能否服務(wù)好AI Agent。
Agent對(duì)數(shù)據(jù)的調(diào)用方式跟人類不一樣。我們面對(duì)的可能是數(shù)十億個(gè)Agent的規(guī)模,一次任務(wù)也可能帶來(lái)無(wú)數(shù)次調(diào)用。
因此企業(yè)真正需要的是一個(gè)AI-ready的數(shù)據(jù)平臺(tái),這會(huì)帶來(lái)跟過(guò)去傳統(tǒng)數(shù)據(jù)平臺(tái)非常不同的挑戰(zhàn)。
結(jié)合我們跟客戶共創(chuàng)的經(jīng)驗(yàn),可以舉幾個(gè)例子。
第一是記憶的共享、隔離與并存。
當(dāng)企業(yè)里幾千個(gè)不同用戶、不同Agent同時(shí)使用時(shí),既需要大家擁有一定共享記憶,同時(shí)又不能串臺(tái)。
如何通過(guò)企業(yè)傳統(tǒng)授權(quán)和權(quán)限管理,把記憶的共享、隔離、長(zhǎng)短期管理都做好,是非常重要的事情。
第二是記憶生命周期管理。
很多人會(huì)認(rèn)為記憶存得越多越好,但其實(shí)并不是。就像人一樣,如果長(zhǎng)期記憶里有錯(cuò)誤知識(shí)、老舊信息,甚至有自相矛盾的知識(shí),都會(huì)影響Agent最終的判斷,這也是為什么長(zhǎng)期記憶管理非常重要。
記憶的生命周期管理,是對(duì)底層數(shù)據(jù)引擎提出的新挑戰(zhàn)。
還有就是Token使用效率。
大家都在關(guān)注Token消耗多、Token貴,但真正導(dǎo)致Token貴的,很大一部分原因容易被忽略:并不只是Token單價(jià)貴,而是你在調(diào)用模型時(shí)喂給了模型太多沒(méi)用的信息。
比如把幾千個(gè)skills一股腦扔給模型,讓它自己去選;又比如在抽取和提取記憶時(shí),沒(méi)有優(yōu)化好最終喂給模型的信息。這些都會(huì)導(dǎo)致Token使用量爆炸。
反過(guò)來(lái)說(shuō),在全鏈條上,我們能不能觀察到模型是怎樣被調(diào)用的?能不能觀測(cè)到它是否產(chǎn)生幻覺(jué)?這種全鏈路可觀測(cè)性,也是AI-ready數(shù)據(jù)平臺(tái)需要滿足的新能力。
如果總結(jié)我們?cè)跇?gòu)建數(shù)據(jù)產(chǎn)品時(shí)秉承的理念,可以分成三大基座。
第一是面向AI-ready,同時(shí)堅(jiān)持可信。
除了云語(yǔ)境下端到端的靜態(tài)數(shù)據(jù)加密、傳輸中數(shù)據(jù)加密和安全保證之外,真正讓數(shù)據(jù)可信,還需要清楚了解數(shù)據(jù)代表的業(yè)務(wù)意義——
它是如何產(chǎn)生的,是由Agent自進(jìn)化而來(lái),還是由業(yè)務(wù)輸入而來(lái);它在全鏈路中如何影響決策。
對(duì)于數(shù)據(jù)可解讀、可管理、可治理的需求,我們?cè)噲D通過(guò)SageMaker Catalog等能力來(lái)解決。
第二是底層數(shù)據(jù)引擎不應(yīng)該成為上層Agent應(yīng)用的阻礙,因此需要有卓越的數(shù)據(jù)底層。
展開(kāi)來(lái)說(shuō),就是可信可靠、性能、性價(jià)比和持久性等能力,都需要保持在很好的水平。
亞馬遜云科技這些年也通過(guò)豐富的數(shù)據(jù)經(jīng)驗(yàn),在引擎層不斷優(yōu)化。
這里舉一個(gè)例子,今天在幾乎所有數(shù)據(jù)引擎里,我們都支持向量能力。
為了適應(yīng)Agent大規(guī)模擴(kuò)展,我們也推出了S3 Vectors,把11個(gè)9持久性的對(duì)象存儲(chǔ)原生支持到大規(guī)模向量檢索和存儲(chǔ)中。
第三是堅(jiān)持開(kāi)放的數(shù)據(jù)架構(gòu),不應(yīng)該形成任何數(shù)據(jù)技術(shù)廠商鎖定或技術(shù)鎖定。
比如在數(shù)據(jù)湖、多模態(tài)數(shù)據(jù)湖以及治理理念上,我們會(huì)圍繞Iceberg這樣的開(kāi)放結(jié)構(gòu),推出S3 Tables,允許不同數(shù)據(jù)引擎進(jìn)行訪問(wèn)。
最近由于Agent被廣泛使用,大家也知道,無(wú)論是管理記憶,還是管理一些其他文件,很多時(shí)候都是通過(guò)文件系統(tǒng)、Markdown文件等方式實(shí)現(xiàn)的。
我們也通過(guò)開(kāi)放方式,讓對(duì)象存儲(chǔ)直接支持相應(yīng)的文件語(yǔ)義,讓Agent可以直接調(diào)用。
這些都是我們?cè)诋a(chǎn)品設(shè)計(jì)中的一些理念,未來(lái)也會(huì)有更多對(duì)客戶數(shù)據(jù)能力的支持。
從企業(yè)級(jí)Harness平臺(tái)到智能化工作應(yīng)用
接下來(lái)這一層,是我更想重點(diǎn)分享的內(nèi)容。
除了模型之外,企業(yè)構(gòu)建Agent需要的是一整套走向生產(chǎn)的能力。
兩年前我也曾在這個(gè)舞臺(tái)上分享過(guò)類似信息,我們一直傳遞的觀點(diǎn)沒(méi)有變:
AI真的不只是大模型這一件事。
到了2026年,在Agent語(yǔ)境下,大家通過(guò)使用龍蝦,通過(guò)感受軟件工程能力,已經(jīng)更清楚地意識(shí)到,把模型拿掉之后,剩下所有關(guān)于生產(chǎn)、控制、管控的生產(chǎn)級(jí)要求,都可以叫做Harness,也就是如何駕馭它。
打個(gè)比方,如果把模型看作CPU,那么真正使用電腦時(shí),沒(méi)有人會(huì)把一塊焊著CPU的主板直接給用戶用。
我們還需要軟件、操作系統(tǒng),以及各種可使用的能力,Harness就是把這些可使用、可操作、可管控的能力放在一起,最終讓Agent呈現(xiàn)為一個(gè)完整應(yīng)用形態(tài)。
對(duì)應(yīng)到亞馬遜云科技的產(chǎn)品,Harness就是Amazon Bedrock AgentCore。
![]()
它的核心價(jià)值,是讓用戶不用在Harness上花太多功夫,而是關(guān)注自己的業(yè)務(wù)價(jià)值。同時(shí)它保持開(kāi)放,可以接入開(kāi)源框架,比如LangChain、CrewAI等,都可以自由集成。
它也管理企業(yè)需要考慮的大規(guī)模安全、穩(wěn)定、自重啟、可靠性等生產(chǎn)級(jí)需求。
如果把Bedrock AgentCore的九大功能模塊快速分成三類。
第一類是讓Agent跑起來(lái)。
Runtime提供自動(dòng)橫向擴(kuò)展能力,讓Agent可以按照任意規(guī)模快速擴(kuò)展;Memory管理記憶和上下文;Code Interpreter和Browser則給Agent加上調(diào)用瀏覽器、操控代碼等能力。
第二類是讓企業(yè)里的數(shù)據(jù)和系統(tǒng)真正接進(jìn)來(lái)。
Identity和Gateway允許企業(yè)把現(xiàn)有系統(tǒng),比如CRM、ERP等很好地集成進(jìn)來(lái),同時(shí)還能繼承員工使用這些系統(tǒng)時(shí)的真實(shí)權(quán)限。
Agent執(zhí)行任務(wù)時(shí)代表的是具體員工,而不是一個(gè)擁有無(wú)限的管理權(quán)限。
第三類是讓Agent真正管得起來(lái)、管得住。
通過(guò)Policy、Evaluation和Observability等功能,企業(yè)可以在Agent執(zhí)行任務(wù)時(shí)設(shè)置邊界,評(píng)估執(zhí)行結(jié)果是否達(dá)到預(yù)期,并對(duì)整個(gè)過(guò)程形成可觀測(cè)能力。
前一陣,我們也跟OpenAI進(jìn)行了官方聯(lián)合發(fā)布,把提供給企業(yè)直接使用的Agent構(gòu)建能力再往上升一級(jí),加入由OpenAI提供支持的Managed Agent。
![]()
可以這樣理解:如果大家認(rèn)為ChatGPT已經(jīng)遠(yuǎn)遠(yuǎn)不只是聊天機(jī)器人,而是一個(gè)可以幫你執(zhí)行任務(wù)的不錯(cuò)Agent,那么Managed Agent就是由OpenAI提供前沿模型,也由OpenAI提供他們?cè)跇?gòu)建Agent過(guò)程中積累的最佳實(shí)踐Harness,再結(jié)合亞馬遜云科技底層安全基礎(chǔ)設(shè)施體系,打包形成的一套能力。
如果企業(yè)更希望通過(guò)OpenAI的能力來(lái)執(zhí)行任務(wù),可以直接采用這個(gè)方案。
相比之下,Bedrock AgentCore提供更加開(kāi)放靈活的Agent框架選擇和模型選擇。
但不變的是,這兩類能力都在同一個(gè)平臺(tái)上,企業(yè)可以同時(shí)選擇,并繼承亞馬遜云科技針對(duì)企業(yè)安全和信任的管控與保護(hù)。
這里也快速引用一個(gè)客戶案例,紫訊采用AgentCore后,解決的核心問(wèn)題是:他們不需要過(guò)度規(guī)劃自己的計(jì)算資源,可以更經(jīng)濟(jì)地快速迭代,也不需要投入大量精力優(yōu)化底層Harness需要處理的生產(chǎn)工程問(wèn)題。
這樣企業(yè)可以更快實(shí)現(xiàn)業(yè)務(wù)價(jià)值,同時(shí)更好地做成本優(yōu)化,把精力放在自己的業(yè)務(wù)訴求上。
Agent應(yīng)用的落地與展望
最后一層,是企業(yè)直接使用Agent應(yīng)用時(shí)需要討論的問(wèn)題:
誰(shuí)來(lái)用?怎么用?
Coding Agent大家已經(jīng)普遍認(rèn)為比較成熟了。
但在工作場(chǎng)景下,Working Agent也是我們認(rèn)為下一個(gè)會(huì)爆發(fā)、會(huì)被廣泛使用的方向,因?yàn)槲覀円呀?jīng)看到了這類能力。
這里有一個(gè)矛盾的問(wèn)題是:?jiǎn)T工希望Agent什么事都幫自己做,了解自己的日常,了解自己的信息;企業(yè)則希望員工安全地使用Agent,希望有管控,不能讓Agent什么事都做。
這兩者其實(shí)可以兼得。
在亞馬遜云科技,我們的答案是通過(guò)Quick這樣的深度個(gè)性化產(chǎn)品來(lái)實(shí)現(xiàn)。
簡(jiǎn)單來(lái)說(shuō),最近我們聽(tīng)到同事分享最多的一句話是:它真的像日常小助手一樣。
我快速分享幾個(gè)自己的體驗(yàn)。
第一,我每天會(huì)在CRM、聊天工具、郵件和各種平臺(tái)之間切換,早上可能要花20分鐘到1個(gè)小時(shí)清理需要處理的任務(wù)。
Quick的主動(dòng)提醒功能,能把這些連接匯聚在一起。它不只是提醒我有哪些事情,還會(huì)主動(dòng)建議我應(yīng)該給某位同事約一個(gè)會(huì),或者給另一位同事做某件事。
第二,它真正執(zhí)行任務(wù)時(shí),能夠幫我們打破傳統(tǒng)工作的邊界。
比如今天這份PPT里,有很多需要外部確認(rèn)的調(diào)研數(shù)據(jù)。過(guò)去我可能要花很多時(shí)間咨詢各位同事,現(xiàn)在通過(guò)Quick很快就可以完成。
第三,它在幫我規(guī)劃任務(wù)時(shí),會(huì)隨著我的使用不斷沉淀。
每個(gè)人在使用時(shí)都會(huì)形成個(gè)人知識(shí)圖譜,隨著使用越來(lái)越多,它的決策也會(huì)越來(lái)越像我,以上是我認(rèn)為Quick帶來(lái)的幾個(gè)非常值得關(guān)注和體驗(yàn)的點(diǎn)。
最后簡(jiǎn)單總結(jié)一下,我們通過(guò)這五層能力,想分享的是:企業(yè)真正把Agent從Demo帶到生產(chǎn),需要關(guān)注哪些點(diǎn)。
這里也可以重新回顧一下我們跟OpenAI的聯(lián)合發(fā)布。
除了剛才提到的Managed Agent,也包括OpenAI最前沿的模型在Bedrock上可用;同時(shí),它的Coding Agent Codex也在Bedrock上可用。
也就是說(shuō),在我們五層架構(gòu)里的三層,通過(guò)跟OpenAI的合作都有了新的能力升級(jí)。
未來(lái),在這五層能力上,我們也會(huì)持續(xù)迭代產(chǎn)品,加速對(duì)企業(yè)的賦能。
簡(jiǎn)單來(lái)說(shuō),我們希望做的事情,就是讓更好的模型,通過(guò)可信的數(shù)據(jù),真正把生產(chǎn)級(jí)平臺(tái)帶給用戶。
Matt Garman說(shuō),每一個(gè)應(yīng)用都將會(huì)被重構(gòu)。
我們確實(shí)已經(jīng)看到領(lǐng)先企業(yè)走在這條路上,也希望通過(guò)五層架構(gòu)的不斷迭代,跟大家一起加速重構(gòu),擁抱Agent時(shí)代,謝謝大家。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.