AI智能體讓科技界變得混亂，成熟的智能體應(yīng)該懂得說不

2026-05-29 10:01:12　來源: 極客網(wǎng)

上海舉報

分享至

在AI領(lǐng)域，我們正處在一個有趣的時刻。模擬人類認知的大語言模型出現(xiàn)，這是第一波浪潮。它類似于谷歌搜索，只是提供、分類并處理信息。

現(xiàn)在行業(yè)進入第二波浪潮，出現(xiàn)了自主任務(wù)引擎（autonomous task engines）。人們不再執(zhí)著于創(chuàng)造擁有自我意識的AI實體，只要它能幫我們處理日常事務(wù)就可以了。

Claude Code發(fā)布之后，智能體大量涌現(xiàn)，標(biāo)志著第二波浪潮形成。于是乎，人們開始認真討論一個問題：AI 將如何改變程序員這一職業(yè)。

今天的智能體已經(jīng)將我們的注意力分散到了無數(shù)個方向。實際上，只有當(dāng)智能體開始把注意力還給我們時，它們才算真正成功，因為智能體可以為我們篩選出真正重要的東西。

從Claude Code和OpenClaw開始

2025年11月，一位名叫施泰因貝格（Peter Steinberger）的39歲中年人開發(fā)了OpenClaw工具，它可以用來召喚AI agent（智能體），工具充分利用了Claude Code或其他編程工具。

OpenClaw一炮而紅。在不到兩周的時間里，用戶瘋狂下載，項目獲得10萬個星標(biāo)。到了5月初，星標(biāo)數(shù)達到36.6萬個。每一個星標(biāo)都意味著工具在Github受到歡迎。

隨著Claude Code和OpenClaw帶來突破，我們期待的智能體時代突然到來。

一位狂熱分子借用威廉·吉布森（William Gibson）的名言呼喊：“通用AI（AGI）就在這里！只是分布得還不均勻。”

前微軟和 Meta 高管托馬斯·里爾登（Thomas Reardon）說：“很難解釋這是一場多么巨大的變革，這是我在科技領(lǐng)域經(jīng)歷過的最被低估、最重大的發(fā)布。”

硅谷著名投資人馬克·安德里森（Marc Andreessen）宣稱：“新工具將成為人們使用計算機的新方式，幾乎不可避免。”

實際上，早在2021年時，OpenAI便推出了Codex，確立AI編程工具的雛形。雖然工具提高了程序員的效率，但產(chǎn)品功能有限，需要仔細監(jiān)督。

按照鮑里斯·切爾尼（Boris Cherny）的設(shè)想，模型應(yīng)該理解編程架構(gòu)，具備解決問題的能力。后來，切爾尼構(gòu)建了Claude Code，并于2025年2月發(fā)布預(yù)覽版本。到了2025年11月，公司推出Opus 4.5，轉(zhuǎn)折點真正出現(xiàn)。

最開始時，團隊并沒有對Claude Code抱有太高期待，認為它只不過是一次漸進式改進，但到了今天，它已經(jīng)可以和人類成果媲美。

Y Combinator首席執(zhí)行官加里·譚（Garry Tan）說：“我一路摸索，試圖搞清楚如何從Claude Code中獲得最大收益。現(xiàn)在我的編程速度是每年400萬行代碼，相當(dāng)于2013年產(chǎn)出的90倍。”

沒多久，世界便出現(xiàn)一個新群體，他們被稱為“Claudeholic”（克勞德成癮者）。這些程序員瘋狂消耗tokens，生怕被變革拋在身后。

科技巨頭一擁而上

英偉達（Nvidia）的黃仁勛對OpenClaw贊不絕口，宣稱它是下一個ChatGPT。工具的創(chuàng)造者彼得·施泰因貝格（Peter Steinberger）被OpenAI招攬，暴露了OpenAI的野心。

最近幾個月，加入新革命的科技巨頭越來越多，它們爭相開發(fā)智能體技術(shù)，競爭越來越激烈，沖在最前方的是 Meta 和谷歌。

據(jù)《金融時報》報道，Meta正在為其用戶構(gòu)建一個高度個性化的 AI 助理，可以執(zhí)行日常任務(wù)。《商業(yè)內(nèi)幕》則說，谷歌正在開發(fā)一個由Gemini驅(qū)動、適用于工作、學(xué)習(xí)和日常生活的個人智能體。

Futurum Group的AI負責(zé)人尼克·佩斯（Nick Patience）認為，引爆智能體浪潮的是OpenClaw，它證明人們需要可以行動的AI，不再滿足于只是給出答案的AI。

Morningstar高級分析師馬利克·艾哈邁德·汗（Malik Ahmed Khan）表示，谷歌和Meta擁有龐大的廣告和電商業(yè)務(wù)，對它們來說，如果智能體能夠進行交易操作，便能創(chuàng)造巨大價值。

Gartner分析師阿倫·錢德拉塞卡蘭（Arun Chandrasekaran）認為，大型科技公司最終會把AI智能體當(dāng)成一種工具，用來增加訂閱者，維護平臺控制權(quán)。智能體可以為它們提供真實價值，為平臺帶來更多參與度，增強實用性，鎖定客戶。智能體還會持續(xù)學(xué)習(xí)，不斷理解用戶語境，增強用戶粘性。

隨著熱度升高，安全和治理也成為當(dāng)務(wù)之急。今年2月，一位Meta員工抱怨稱，OpenClaw擅自刪除大量電子郵件，該事件迅速走紅。信任問題也不可忽視，如果智能體做錯事，會導(dǎo)致嚴(yán)重后果，需要管控。

佩斯稱：“以前是會說錯話的AI，現(xiàn)在變成會做錯事的AI，二者的風(fēng)險完全不同，給從業(yè)者帶來巨大挑戰(zhàn)。大多數(shù)企業(yè)，甚至可以說大多數(shù)供應(yīng)商，目前還沒有能力在規(guī)模化層面應(yīng)對這一挑戰(zhàn)。”

盡管挑戰(zhàn)重重，智能體需求是真實存在的。AMD首席執(zhí)行官蘇姿豐（Lisa Su）最近告訴媒體，智能體正在拉動 AI 周期中的巨大需求。

Forrester的首席分析師克雷格·勒克萊爾（Craig Le Clair）表示：“智能體開發(fā)并不是一個副業(yè)，它是 2026 年路線圖的主題，代表著從‘搜索’到‘行動’的轉(zhuǎn)折點。”

William Blair公司主管阿瓊·巴蒂亞（Arjun Bhatia）坦言，當(dāng)前各大公司都在爭相打造能賺錢的AI工具，競爭只會變得越來越激烈，智能體戰(zhàn)爭已經(jīng)全面打響。

成熟的AI智能體應(yīng)該懂得說不

和任何狂潮一樣，智能體大戰(zhàn)也滋生了泡沫。據(jù)Gartner預(yù)測，40%的組織計劃對智能體進行降級，甚至直接停用。

如果企業(yè)不考慮智能體的自主程度或行動范圍，試圖為所有智能體建立一套統(tǒng)一的治理體系，將會導(dǎo)致企業(yè)在業(yè)務(wù)自動化上失敗。

智能體會調(diào)用大語言模型來理解用戶的自然語言請求或指令，隨后與應(yīng)用數(shù)據(jù)進行交互，對其更新。除了谷歌和Meta，SAP、甲骨文（Oracle）、Workday 和 Salesforce都在炒作這一概念。

然而，Gartner警告稱，絕大多數(shù)組織不太可能建立起正確的治理模型。當(dāng)企業(yè)無法區(qū)分智能體的“行動能力”與“訪問范圍”時，智能體的落地實施就很容易出錯。

Gartner高級總監(jiān)分析師希瓦·瓦爾瑪（Shiva Varma）警告稱：“組織正將智能體的治理視為二元選擇，非黑即白，要么完全鎖死，要么完全信任，而這正是失敗的根源。”

有時，企業(yè)會對智能體“過度限制”，從而拖慢交付速度，要么“限制不足”，導(dǎo)致運營成本增加，滋生安全合規(guī)風(fēng)險。

瓦爾瑪認為，AI智能體的行動規(guī)模和速度可能會超出人類的監(jiān)管能力。一些人認為，一個成熟的AI智能體不僅要會“做事”，更要懂得在什么時候“停手”。

一本正經(jīng)胡說八道是所有大語言模型的通病，如果是能執(zhí)行行動的智能體呢？當(dāng)它遇到缺乏上下文、情況模糊的環(huán)境時，能否客觀承認自己不知道？能否知道自己沒有權(quán)限處理當(dāng)前情況？這些問題至關(guān)重要。

簡單來說，如果不給智能體一個“棄權(quán)”選項，讓它一直執(zhí)行，后果極為嚴(yán)重。

Claude Code已經(jīng)加入了類似的設(shè)計，在運行命令或修改文件之前，智能體必須獲得許可。如果是低風(fēng)險、可逆的工作，可以交給智能體來做；如果是永久刪除文件或內(nèi)容、參與大額金融交易，還是讓人類接管比較好；如果請求涉及敏感數(shù)據(jù)、影響巨大，智能體應(yīng)該拒絕行動。

總之，聰明的智能體應(yīng)該知道何時停下，告訴用戶“我沒有權(quán)限處理此事”，如果做不到，便是沒有成熟，沒有準(zhǔn)備好。（小刀）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.