Jay 發自 凹非寺
量子位 | 公眾號 QbitAI
重要發現:AI的自進化,開始了。
這是Anthropic剛剛在長文博客中,發表的暴論。
我們的內部數據顯示,Claude正在加速AI發展,這可能是一條遞歸自我提升(RSI)的路徑。
![]()
并非「危言聳聽」,看了下文章,Anthropic是真的實打實地用數據在說話——
截止今年5月,80%以上的Anthropic代碼,都是Claude寫的。
而在Claude Code發布之前,這個數字還僅是個位數。
與此同時,Anthropic工程師平均每季度交付的代碼量,是2021-2025年的8倍。
![]()
更重要的是質量——
在最開放、最模糊、連答案長什么樣都不確定的編程任務上,Claude的成功率現在是76%,六個月前才26%。
50個百分點的跳升。半年。
![]()
Anthropic內部已經有不少工程師覺得,Claude寫的代碼質量和人類打平了。
預計年內會超過。
Anthropic還強調,如果這個趨勢持續下去,AI自己設計和構建下一代AI,是完全可能的。
這可能徹底改變社會,在醫療、科技、經濟領域帶來巨大的好處。但也可能讓對齊問題疊加惡化,最終導致失控。
因此,Anthropic帶頭呼吁:
如果存在一個可驗證的機制,能保證AI實驗室確實都沒偷偷卷,我們愿意減速、甚至暫停。
除此之外,Anthropic的這篇博客里,還放出了蠻多有意思的觀點和事實。
以下是經過整理,更方便大家閱讀的版本。
Enjoy。
Anthropic長文定調
AI圈的摩爾定律來了
Anthropic創建了個全新的衡量維度,叫「AI能獨立完成的任務時長」。
2024年3月,Claude Opus 3能搞定人類大概需要4分鐘的軟件任務。
一年后,Claude Sonnet 3.7,1.5小時。
又一年,Claude Opus 4.6,12小時。
而最新的Mythos,在內測中的表現是:
能連續工作「至少」16小時,已經到了METR測試框架能衡量的上限了。
這個翻倍速度,從原來的每7個月翻一倍,加速到了每4個月翻一倍。
如果趨勢不變,2027年,可能是好幾周。
![]()
Claude編寫了大部分Anthropic代碼
截至2026年5月,我Anthropic代碼庫的代碼,超過80%由Claude編寫。
在Claude Code發布前,這個數字一直只有個位數。
這種變化,也體現在工程師的工作方式上。
在 Anthropic 的最初四年,工程師每天Merge的代碼行數基本保持不變。
2025年, Claude開始自己寫代碼,merge數突然開始飆升。
如今,2026年第二季度,工程師每天merge的代碼量是2024年的8倍。
![]()
不過,代碼量上去了,代碼質量是不是注水了?
Anthropic說,這一年來,工程師糾正Claude的次數,越來越少了。
這一點,在benchmark中可見一斑,如下圖所示。
所有難度類型的任務中,Claude的成功率,無一例外的一路暴增。
![]()
所以,Anthropic現在干脆用Claude來review代碼。
是的,所有提交到代碼庫的改動,都會先過一遍Claude自動審查,檢查bug、安全漏洞和其他缺陷。
他們回溯分析發現,如果之前每次改動都有這道自動審查,大約三分之一導致claude.ai線上事故的bug,上線之前就會被攔下來。
要知道,寫那些代碼的工程師,已經是全世界造AI系統最頂尖的一批人了。
Claude在抓他們的錯誤。
創造力的放大鏡
接下來是Claude在研究層面的參與程度。
Anthropic有個慣例,每次發新模型,都會給Claude一段訓練小型AI模型的代碼,讓它在保證正確性的前提下,把運行速度優化到最快。
2025年5月,Claude Opus 4交出的答案是:加速3倍。
2026年4月,Claude Mythos Preview做到了52倍。
作為參考,一個熟練的人類研究員,需要4到8個小時才能勉強達到4倍。
不到一年的時間,Claude超過了人類。
2026年4月,Anthropic丟給Claude一個AI安全研究,大意是「一個弱模型能不能可靠地監督一個強模型」,然后讓Claude自己提假設、跑實驗……
這次先說人類的表現吧,兩個人類研究員花了大約一周時間,把gap縮小了23%。
而Claude,在大約800小時、花了大約18000美元的算力之后——
縮小了97%。
![]()
我們何去何從?
到這里為止,結論已經很清楚了。
人類在AI開發流程里的角色,每一個環節都在收窄。
代碼,Claude寫了。代碼review,Claude做了。實驗執行,Claude快了人類一個數量級。實驗設計,Claude開始自己來了……
人類現在最后的比較優勢,是研究品味和判斷力。
但這個優勢能守多久?
Anthropic在博客里說,他們也不確定。
一種可能是,「研究品味」就像之前AI不會的其他東西一樣,先是做不到,然后突然就做到了。
就像AI理解幽默、展示心智理論、解語言謎題,都經歷了同樣的曲線。
另一種可能是,即便Claude永遠學不會真正的研究品味,僅靠現在的加速趨勢,每個人類研究員能同時指揮的工作量已經大了好幾倍。
你不需要AI完全替代你思考,它只要把所有「執行」的活全干了,你就只需要做那5%的方向選擇。
![]()
RSI的三種未來
博客結尾,Anthropic描繪了關于這次「自進化」趨勢三個可能演化方向。
1、停滯。
那些指數曲線其實是S曲線。
也許研究判斷力這個東西就是沒法靠scale解決,需要一種全新的架構突破。
或者,瓶頸在能源、在芯片、在算力的物理供應鏈上。
不過,即便AI的能力就停滯在今天的水平,也會發生對世界帶來重大變化。
前段時間的Project Glasswing,Mythos Preview在上線頭幾周就發現了超過一萬個高危和嚴重級別的軟件漏洞,遍布全球最關鍵的系統。
2、AI持續加速,但人類仍然把著方向盤。
組織效率會指數級提升,100人的公司做1萬甚至10萬人的活。知
Anthropic覺得我們大概率正在走進這個場景。
但他們也發現了一個有意思的現象,就是阿姆達爾定律在組織里的體現_
Claude把代碼寫得飛快了,結果代碼review變成了新瓶頸。各種新想法、新工具、新實驗爆炸式涌現,遠超組織的消化能力。
瓶頸不會消失,只是轉移到下一個環節。
3、AI實現完全的遞歸自我提升,開始自己造下一代自己。
這個場景下,AI的發展速度完全取決于算力了。人類退到監督、驗證、審核的位置。
如果真的發生,這種能力大概率會遷移到其他科學領域,醫學、材料、能源,全線起飛。
當然,另一種未來,是對齊失敗。
這種情況下,偏差會在AI自我迭代的過程中逐步累積,最終——完全失控。
OMT
以上,便是Anthropic此次關于自進化,最關鍵的幾個觀點。
說實話,最開始我其實沒太當回事,畢竟Anthropic馬上就要IPO了,這一波不是典型的「Anthropic式」公關?
你別說,這次,可能真的有點不一樣。
因為就在幾天前,OpenAI也發布了類似的博客:
我們也在當今系統中看到自進化的早期跡象: AI的發展本身也被AI加速。
我們預計這將加劇開發商和國家之間的競爭壓力,并帶來現有機構無法應對的治理挑戰。
隨著RSI的出現,社會需要方法塑造AI的發展軌跡 ,確保其服務于人類利益。
![]()
奇點,似乎來得比所有人預想的都要快。
博客:https://www.anthropic.com/institute/recursive-self-improvement
參考鏈接:
[1]https://x.com/kimmonismus/status/2062517474277675102
[2]https://x.com/anthropicai/status/2062568873321513443
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.