<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      科研奇點已至:AI兩小時完成博士數月工作

      0
      分享至

      【導讀】就在今天,Agentic AI工程師發現:博士80小時的科研任務,Codex不到2小時就跑完了,效率差達到了40倍!其實按照舊標準,AGI早已存在了,只是全行業都在移動球門。

      科研界的「奇點」真的來了,比所有人預想的都要近。

      近日,一項針對Codex「目標模式(Goal Mode)」的實驗震驚了學術界:Codex可以讓AI科研效率猛增40倍!

      Agentic AI工程師Dan McAteer近日在X上披露一次實驗:用OpenAI Codex的Goal Mode跑一項機械可解釋性(Mechanistic Interpretability)研究任務。



      GPT-5.5自己估算這個任務博士可能需要約80小時才完成,在實際操作中,AI 僅用時1小時56分鐘便徹底完成了任務。



      表面效率提升約40倍!



      他所使用的是Codex中一種內置的技能 /goal。

      也就是,讓模型自行設定目標,其中的關鍵就是它寫出的提示詞很可能比你的更出色。



      這不再是簡單的「效率提升」,而是一場徹頭徹尾的「降維打擊」。

      當科研周期從以「周」為單位縮減至「小時」,當 AI 開始自主撰寫自己的實驗目標(/goal),我們必須承認一個殘酷的現實:

      「智能爆炸」的斜率已經現身,AI 的自我迭代速度正在脫離人類的掌控節奏!

      先來看看這個實驗是怎么進行的。

      實驗發起人是Dan McAteer,Agentic AI工程師,前Amp Code工程師。

      常年在X上分享AI agent工程化的具體實踐。



      他的實驗配置很簡單——

      他自己對這套配置的描述是:當前可用的最高效的AI智能體配置。

      這件事真正值得說的是Codex /goal這個模式本身。



      按OpenAI Codex工程師Philip Corey的描述,/goal是我們對Ralph loop的一種實現——讓目標在多輪對話里持續存在,不達成不停止。

      簡單說,普通的Codex調用是你說一句、它做一步、回你一句。

      Codex /goal是你說一個目標、它自己拆分子任務、自己執行、自己review、自己繼續,直到達成或失敗。

      這是從對話式AI到目標驅動AI的工程切換。



      對Mechanistic Interpretability這類研究任務,/goal模式的天然契合度高。

      研究流程本身就是提出假設→設計實驗→運行→看結果→修正假設→再實驗的循環,正好可以喂給一個會自我循環的agent。

      McAteer的實驗真正證明的,是Codex /goal 模式在科研型循環任務上具備可用性:不是替代研究員,是替代研究員的重復操作部分。



      這個能力如果能穩定下來,對AI研究本身有非常直接的杠桿。

      它意味著AI實驗室自己內部的AI研究員,未來某天可以用AI agent去做訓練數據準備、實驗設置、消融研究、可視化生成、初步結果分析這些重復工作。

      這也就是Anthropic和OpenAI最近反復說的AI正在加速AI研究本身。

      這套流程之所以漫長,是因為人類大腦在處理復雜邏輯和海量數據時,存在物理上限。

      但Codex的這次實驗徹底打破了這種認知。



      在「/goal + GPT-5.5 High + Fast Mode」的最強智能體配置下,AI不再是一個「聽指令」的工具,而是一個「出策略」的獨立研究員。

      它能夠理解復雜的自然語言自動編碼器(NLA)實驗需求,自主拆解任務,并在不到2小時的時間里走完了人類精英需要兩周才能走完的路。

      這代表著,從此人類的科研門檻徹底崩塌。曾經需要數年寒窗苦讀換來的專業分析能力,正在被算法模塊化。

      而且,自主AI研究員已經提前降臨了!

      OpenAI此前設定的目標是2026年底實現AI自主科研。

      但從目前的實驗進度看,2026年可能不是開始,而是人類徹底交出科研接力棒的終點。

      如果說Codex 40倍速實驗是一個刺眼的個案,那更讓人坐不住的,是圍繞「遞歸自我改進」的證據正在密集涌現。

      5月7日,據Axios報道,Anthropic聯創Jack Clark公開給出了一個概率:

      到2028年底,AI實現完全遞歸自我改進的概率超過60%。





      Sakana AI和UBC的研究團隊今年造出了Darwin G?del Machine,一個能改寫自己源代碼來提升自身能力的編程智能體。



      在SWE-bench上,它的得分從20.0%自我提升到50.0%。全程沒有人類插手。



      同一個團隊的AI Scientist項目今年3月發表在Nature上。

      一整條科研流水線,從頭到尾,AI獨立完成。



      再看一組硬數據。GPQA Diamond,一個由博士專家出題的科學問答基準。2023年11月GPT-4得分39%。人類領域專家的平均水平約65%。

      2026年4月,前沿模型集體越線:Gemini 3.1 Pro得分94.3%,Claude Opus 4.7得分94.2%。

      所有前沿模型都已遠遠甩開人類博士專家。



      SWE-bench的軌跡更能說明加速度。



      2023年底,Claude 2的通過率是2%。現在,93.9%。

      兩年半,就從2%飆升到了93.9%。

      這條曲線畫出來,任何一個學過高中數學的人都認識它的形狀。

      顯然,遞歸自我改進(RSI)的進程已經開始。

      一旦 AI 開始用這種 40 倍的效率去改寫自己的底層代碼、優化自己的架構,智力的增長將不再是線性的,而是垂直向上的。



      按照 2022 年之前的定義,AGI其實早已實現。

      之所以現在還沒人承認,是因為整個AI行業正在對公眾進行一場集體性的「煤氣燈效應」。



      2022 年前,只要能通過圖靈測試、能跨領域處理任務,就是AGI。

      ChatGPT出現后: 「光有這些不行,還得有完美的推理、得有身體(具身性)、得有自我意識。」

      每當模型突破一個關口,人類就會即興加入新的、虛無縹緲的指標作為門檻,不斷移動球門。

      問題是,如果AGI已經存在,那么現在的行業邏輯就變得極其荒誕。

      OpenAI 還在籌集 400 億美元聲稱要「構建 AGI」;Anthropic 每次發布新模型都要包裝成「接近 AGI」的期貨。



      如今,我們正處于一個極其詭異的節點。

      在實驗室里,AI已經用 40 倍速在進行機械解釋性研究,甚至在幫自己寫代碼。

      在市場上,算力依然是硬通貨,英偉達的 Blackwell 芯片被瘋搶,每一塊芯片都在加速那個奇點的到來。

      然而在社會心理上,大眾還在用「復讀機」和「概率預測」這種過時的詞匯來安慰自己。

      當 AI 能夠獨立完成博士級任務時,我們現有的教育體系、職稱評定、甚至專家這個詞本身的含義,都將面臨滅頂之災。

      正如哥白尼將地球移出了宇宙中心,現在的 AI 正在將人類移出「唯一智慧生命」的圣殿。

      現在,這場名為智能爆炸的戰爭沒有硝煙。

      我們要么學會如何與這種智能新物種共生,要么就只能眼睜睜地看著它,以 40 倍的速度,把我們甩在塵埃里。

      聲明:個人原創,僅供參考

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      晚年最大的清醒:寧可孤獨終老,也不要在這6件事上犯糊涂!

      晚年最大的清醒:寧可孤獨終老,也不要在這6件事上犯糊涂!

      熱心市民小黃
      2026-05-29 11:16:40
      麻將搭子的團結有多離譜?網友:為了湊局,啥事都干得出來

      麻將搭子的團結有多離譜?網友:為了湊局,啥事都干得出來

      夜深愛雜談
      2026-06-01 19:25:47
      波蘭要求澤連斯基道歉

      波蘭要求澤連斯基道歉

      參考消息
      2026-06-02 15:25:20
      編制終身制要取消?體制內4200萬人的命運,被這一紙文件改寫?

      編制終身制要取消?體制內4200萬人的命運,被這一紙文件改寫?

      今朝牛馬
      2026-06-02 20:49:51
      A股:緊急提醒2.5億股民!從今天6月3日起,A股牛回頭或接近尾聲?

      A股:緊急提醒2.5億股民!從今天6月3日起,A股牛回頭或接近尾聲?

      趨勢清風俠
      2026-06-03 08:14:35
      在岸人民幣兌美元(CNY)北京時間03:00收報6.7650元,較周一夜盤收盤漲10點

      在岸人民幣兌美元(CNY)北京時間03:00收報6.7650元,較周一夜盤收盤漲10點

      每日經濟新聞
      2026-06-03 05:49:02
      稻城亞丁景區彎道占比超八成,游客建議“接駁車合理收費”……記者實探→

      稻城亞丁景區彎道占比超八成,游客建議“接駁車合理收費”……記者實探→

      環球網資訊
      2026-06-02 21:36:26
      瑞幸誤將聯名的Hello Kitty寫成“Heelo Kitty”,多人拿到錯版!客服回應:可換新也可退款

      瑞幸誤將聯名的Hello Kitty寫成“Heelo Kitty”,多人拿到錯版!客服回應:可換新也可退款

      封面新聞
      2026-06-02 15:44:30
      伊朗襲擊科威特基地,致美方7人受傷;美軍:正執行對伊海上封鎖;黃仁勛:AI時代無需過度糾結“應該學什么專業”丨每經早參

      伊朗襲擊科威特基地,致美方7人受傷;美軍:正執行對伊海上封鎖;黃仁勛:AI時代無需過度糾結“應該學什么專業”丨每經早參

      每日經濟新聞
      2026-06-01 06:49:04
      情侶手鏈,王楚欽戀情實錘?

      情侶手鏈,王楚欽戀情實錘?

      乒乓樂園
      2026-06-03 00:07:50
      女員工嘲諷顧客“窮逛”后續:本人火到香港已社死,商場也被坑慘

      女員工嘲諷顧客“窮逛”后續:本人火到香港已社死,商場也被坑慘

      哄動一時啊
      2026-06-01 19:30:38
      那中國給的算什么?菲律賓防長:中國給化肥和燃料,是包裝和欺騙

      那中國給的算什么?菲律賓防長:中國給化肥和燃料,是包裝和欺騙

      阿龍聊軍事
      2026-06-02 21:03:19
      汪峰帶五娃過六一!森林北女兒緊挨媽媽,小女兒醒醒乖巧又大方

      汪峰帶五娃過六一!森林北女兒緊挨媽媽,小女兒醒醒乖巧又大方

      阿廢冷眼觀察所
      2026-06-03 00:11:04
      趙海燕兒子結婚太糟心!大姑閆學晶意外缺席,兒媳婦體態遭到嘲諷

      趙海燕兒子結婚太糟心!大姑閆學晶意外缺席,兒媳婦體態遭到嘲諷

      阿褲趣聞君
      2026-06-02 23:51:08
      他達拉非立大功!研究發現:中老年吃他達拉非,改善5類難言之隱

      他達拉非立大功!研究發現:中老年吃他達拉非,改善5類難言之隱

      健康科普365
      2026-05-28 21:10:13
      這兩樣東西千萬別放冰箱,堪稱家里的“定時炸彈”,很多家庭都有

      這兩樣東西千萬別放冰箱,堪稱家里的“定時炸彈”,很多家庭都有

      叮當當科技
      2026-06-01 18:45:28
      婆婆當眾罵我二手貨,我笑問公公:你養了29年的兒子到底真親生嗎

      婆婆當眾罵我二手貨,我笑問公公:你養了29年的兒子到底真親生嗎

      楓紅染山徑
      2026-06-03 09:05:50
      計劃下降超0.4元/升,油價降幅“縮水”,明晚24時調價,加油別急

      計劃下降超0.4元/升,油價降幅“縮水”,明晚24時調價,加油別急

      豬友巴巴
      2026-06-03 09:43:25
      印度擬購114架“陣風”戰機,軍方稱必要時準備“辛杜爾行動2.0”

      印度擬購114架“陣風”戰機,軍方稱必要時準備“辛杜爾行動2.0”

      澎湃新聞
      2026-06-02 19:30:33
      別等老了才醒悟,余生最貴的,從來不是錢財,是生活中的這些道理

      別等老了才醒悟,余生最貴的,從來不是錢財,是生活中的這些道理

      三農老歷
      2026-06-03 00:17:27
      2026-06-03 10:32:49
      地球記
      地球記
      科普世界地理知識,有不對的歡迎指正!
      817文章數 793關注度
      往期回顧 全部

      科技要聞

      員工抗議鍵鼠追蹤,Meta讓步:可暫停30分鐘

      頭條要聞

      牛彈琴:中國一鄰國正在瘋狂表演 嚴重傷害中國人感情

      頭條要聞

      牛彈琴:中國一鄰國正在瘋狂表演 嚴重傷害中國人感情

      體育要聞

      1米74的業余聯賽替補,在英超踢中衛

      娛樂要聞

      奚夢瑤何猷君補辦婚禮超幸福

      財經要聞

      左手通脹右手衰退,歐美當下的困局

      汽車要聞

      星途神秘新車輪廓曝光 又一款性能SUV要來了?

      態度原創

      房產
      教育
      親子
      本地
      手機

      房產要聞

      5200巨量投資曝光!未來五年,海南格局大變!

      教育要聞

      小學幾何題,難倒了不少的家長和學生,換個思路試試

      親子要聞

      可愛小豬歡樂歌

      本地新聞

      用剪紙的方式,打開江蘇揚州

      手機要聞

      三星Galaxy Z Fold8 / Ultra機模對比照片曝光

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 三级精品| 亚洲精品国产无套在线观| 国产亚洲情侣一区二区无码av | 国产AV一区二区精品凹凸| 精品卡一卡二卡乱码高清| 亚洲熟女乱综合一区二区| 亚洲天天堂天堂激情性色| 午夜激情影院| 人妻中文字幕不卡精品| 国产国产国产国产系列| 五月天婷婷社区| 亚洲男女羞羞无遮挡久久丫| 日韩人妻一区中文字幕| 国产免费自拍视频| 一本色道久久综合无码人妻软件| 国产精品一区av在线观看| 免费看AV毛片一区二区三区 | 国产亚洲精品福利在线无卡一| 中文字幕视频在线观看| 亚洲精品92内射| 天天爽天天摸天天碰| 国产精品中文| 大地资源高清免费观看| 色欲色欲久久综合网| 成人免费视频试看120秒| 亚洲国产aⅴ成人精品无吗| 麻豆亚州无矿码专区视频| 国产成人精品1024免费下载| 狠狠色伊人久久精品综合网| 久久青青草原精品国产app| 色午夜av男人的天堂| 国产强伦姧在线观看| 最新中文字幕免费观看| 护士张开腿被奷日出白浆| 激情六月丁香婷婷四房播| 女女热在线视频精品| 激情综合网激情综合| www.97| 国产l精品国产亚洲区久久| 超碰成人免费| 精品亚洲国产成人av|