在AI領(lǐng)域,我們正處在一個有趣的時刻。模擬人類認知的大語言模型出現(xiàn),這是第一波浪潮。它類似于谷歌搜索,只是提供、分類并處理信息。
現(xiàn)在行業(yè)進入第二波浪潮,出現(xiàn)了自主任務(wù)引擎(autonomous task engines)。人們不再執(zhí)著于創(chuàng)造擁有自我意識的AI實體,只要它能幫我們處理日常事務(wù)就可以了。
Claude Code發(fā)布之后,智能體大量涌現(xiàn),標(biāo)志著第二波浪潮形成。于是乎,人們開始認真討論一個問題:AI 將如何改變程序員這一職業(yè)。
今天的智能體已經(jīng)將我們的注意力分散到了無數(shù)個方向。實際上,只有當(dāng)智能體開始把注意力還給我們時,它們才算真正成功,因為智能體可以為我們篩選出真正重要的東西。
![]()
從Claude Code和OpenClaw開始
2025年11月,一位名叫施泰因貝格(Peter Steinberger)的39歲中年人開發(fā)了OpenClaw工具,它可以用來召喚AI agent(智能體),工具充分利用了Claude Code或其他編程工具。
OpenClaw一炮而紅。在不到兩周的時間里,用戶瘋狂下載,項目獲得10萬個星標(biāo)。到了5月初,星標(biāo)數(shù)達到36.6萬個。每一個星標(biāo)都意味著工具在Github受到歡迎。
隨著Claude Code和OpenClaw帶來突破,我們期待的智能體時代突然到來。
一位狂熱分子借用威廉·吉布森(William Gibson)的名言呼喊:“通用AI(AGI)就在這里!只是分布得還不均勻。”
前微軟和 Meta 高管托馬斯·里爾登(Thomas Reardon)說:“很難解釋這是一場多么巨大的變革,這是我在科技領(lǐng)域經(jīng)歷過的最被低估、最重大的發(fā)布。”
硅谷著名投資人馬克·安德里森(Marc Andreessen)宣稱:“新工具將成為人們使用計算機的新方式,幾乎不可避免。”
實際上,早在2021年時,OpenAI便推出了Codex,確立AI編程工具的雛形。雖然工具提高了程序員的效率,但產(chǎn)品功能有限,需要仔細監(jiān)督。
按照鮑里斯·切爾尼(Boris Cherny)的設(shè)想,模型應(yīng)該理解編程架構(gòu),具備解決問題的能力。后來,切爾尼構(gòu)建了Claude Code,并于2025年2月發(fā)布預(yù)覽版本。到了2025年11月,公司推出Opus 4.5,轉(zhuǎn)折點真正出現(xiàn)。
最開始時,團隊并沒有對Claude Code抱有太高期待,認為它只不過是一次漸進式改進,但到了今天,它已經(jīng)可以和人類成果媲美。
Y Combinator首席執(zhí)行官加里·譚(Garry Tan)說:“我一路摸索,試圖搞清楚如何從Claude Code中獲得最大收益。現(xiàn)在我的編程速度是每年400萬行代碼,相當(dāng)于2013年產(chǎn)出的90倍。”
沒多久,世界便出現(xiàn)一個新群體,他們被稱為“Claudeholic”(克勞德成癮者)。這些程序員瘋狂消耗tokens,生怕被變革拋在身后。
科技巨頭一擁而上
英偉達(Nvidia)的黃仁勛對OpenClaw贊不絕口,宣稱它是下一個ChatGPT。工具的創(chuàng)造者彼得·施泰因貝格(Peter Steinberger)被OpenAI招攬,暴露了OpenAI的野心。
最近幾個月,加入新革命的科技巨頭越來越多,它們爭相開發(fā)智能體技術(shù),競爭越來越激烈,沖在最前方的是 Meta 和谷歌。
據(jù)《金融時報》報道,Meta正在為其用戶構(gòu)建一個高度個性化的 AI 助理,可以執(zhí)行日常任務(wù)。《商業(yè)內(nèi)幕》則說,谷歌正在開發(fā)一個由Gemini驅(qū)動、適用于工作、學(xué)習(xí)和日常生活的個人智能體。
Futurum Group的AI負責(zé)人尼克·佩斯(Nick Patience)認為,引爆智能體浪潮的是OpenClaw,它證明人們需要可以行動的AI,不再滿足于只是給出答案的AI。
Morningstar高級分析師馬利克·艾哈邁德·汗(Malik Ahmed Khan)表示,谷歌和Meta擁有龐大的廣告和電商業(yè)務(wù),對它們來說,如果智能體能夠進行交易操作,便能創(chuàng)造巨大價值。
Gartner分析師阿倫·錢德拉塞卡蘭(Arun Chandrasekaran)認為,大型科技公司最終會把AI智能體當(dāng)成一種工具,用來增加訂閱者,維護平臺控制權(quán)。智能體可以為它們提供真實價值,為平臺帶來更多參與度,增強實用性,鎖定客戶。智能體還會持續(xù)學(xué)習(xí),不斷理解用戶語境,增強用戶粘性。
隨著熱度升高,安全和治理也成為當(dāng)務(wù)之急。今年2月,一位Meta員工抱怨稱,OpenClaw擅自刪除大量電子郵件,該事件迅速走紅。信任問題也不可忽視,如果智能體做錯事,會導(dǎo)致嚴(yán)重后果,需要管控。
佩斯稱:“以前是會說錯話的AI,現(xiàn)在變成會做錯事的AI,二者的風(fēng)險完全不同,給從業(yè)者帶來巨大挑戰(zhàn)。大多數(shù)企業(yè),甚至可以說大多數(shù)供應(yīng)商,目前還沒有能力在規(guī)模化層面應(yīng)對這一挑戰(zhàn)。”
盡管挑戰(zhàn)重重,智能體需求是真實存在的。AMD首席執(zhí)行官蘇姿豐(Lisa Su)最近告訴媒體,智能體正在拉動 AI 周期中的巨大需求。
Forrester的首席分析師克雷格·勒克萊爾(Craig Le Clair)表示:“智能體開發(fā)并不是一個副業(yè),它是 2026 年路線圖的主題,代表著從‘搜索’到‘行動’的轉(zhuǎn)折點。”
William Blair公司主管阿瓊·巴蒂亞(Arjun Bhatia)坦言,當(dāng)前各大公司都在爭相打造能賺錢的AI工具,競爭只會變得越來越激烈,智能體戰(zhàn)爭已經(jīng)全面打響。
成熟的AI智能體應(yīng)該懂得說不
和任何狂潮一樣,智能體大戰(zhàn)也滋生了泡沫。據(jù)Gartner預(yù)測,40%的組織計劃對智能體進行降級,甚至直接停用。
如果企業(yè)不考慮智能體的自主程度或行動范圍,試圖為所有智能體建立一套統(tǒng)一的治理體系,將會導(dǎo)致企業(yè)在業(yè)務(wù)自動化上失敗。
智能體會調(diào)用大語言模型來理解用戶的自然語言請求或指令,隨后與應(yīng)用數(shù)據(jù)進行交互,對其更新。除了谷歌和Meta,SAP、甲骨文(Oracle)、Workday 和 Salesforce都在炒作這一概念。
然而,Gartner警告稱,絕大多數(shù)組織不太可能建立起正確的治理模型。當(dāng)企業(yè)無法區(qū)分智能體的“行動能力”與“訪問范圍”時,智能體的落地實施就很容易出錯。
Gartner高級總監(jiān)分析師希瓦·瓦爾瑪(Shiva Varma)警告稱:“組織正將智能體的治理視為二元選擇,非黑即白,要么完全鎖死,要么完全信任,而這正是失敗的根源。”
有時,企業(yè)會對智能體“過度限制”,從而拖慢交付速度,要么“限制不足”,導(dǎo)致運營成本增加,滋生安全合規(guī)風(fēng)險。
瓦爾瑪認為,AI智能體的行動規(guī)模和速度可能會超出人類的監(jiān)管能力。一些人認為,一個成熟的AI智能體不僅要會“做事”,更要懂得在什么時候“停手”。
一本正經(jīng)胡說八道是所有大語言模型的通病,如果是能執(zhí)行行動的智能體呢?當(dāng)它遇到缺乏上下文、情況模糊的環(huán)境時,能否客觀承認自己不知道?能否知道自己沒有權(quán)限處理當(dāng)前情況?這些問題至關(guān)重要。
簡單來說,如果不給智能體一個“棄權(quán)”選項,讓它一直執(zhí)行,后果極為嚴(yán)重。
Claude Code已經(jīng)加入了類似的設(shè)計,在運行命令或修改文件之前,智能體必須獲得許可。如果是低風(fēng)險、可逆的工作,可以交給智能體來做;如果是永久刪除文件或內(nèi)容、參與大額金融交易,還是讓人類接管比較好;如果請求涉及敏感數(shù)據(jù)、影響巨大,智能體應(yīng)該拒絕行動。
總之,聰明的智能體應(yīng)該知道何時停下,告訴用戶“我沒有權(quán)限處理此事”,如果做不到,便是沒有成熟,沒有準(zhǔn)備好。(小刀)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.