<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      一個(gè)問(wèn)題幾百美元,DeepMind智能體一次搞定了9個(gè)Erd?s問(wèn)題

      0
      分享至



      機(jī)器之心編輯部

      又有 9 個(gè)埃爾德什(Erd?s)問(wèn)題被 AI 解決了,這次是 DeepMind 團(tuán)隊(duì)實(shí)現(xiàn)的。

      上周日,大模型科研領(lǐng)域再次傳來(lái)里程碑事件:DeepMind 的大模型在一次「測(cè)試」中,直接解決了 9 個(gè)開放的 Erd?s 問(wèn)題。這次 AI 不僅自動(dòng)解題,還進(jìn)行了自動(dòng)驗(yàn)證,隨后其解法通過(guò)了人工審查。這次研究是數(shù)學(xué)界和 AI 界已知的首次針對(duì)開放式研究級(jí)數(shù)學(xué)問(wèn)題進(jìn)行的大規(guī)模形式化證明搜索評(píng)估。

      現(xiàn)在,AI 不再只是在做奧數(shù)題了,現(xiàn)在它們已稱得上是正經(jīng)的「科研人員」。



      • 論文:Advancing Mathematics Research with AI-Driven Formal Proof Search
      • 論文鏈接:https://arxiv.org/abs/2605.22763v1

      最近一段時(shí)間,大語(yǔ)言模型(LLM)在數(shù)學(xué)推理方面展現(xiàn)出了卓越的能力,但其固有的不穩(wěn)定性限制了其在數(shù)學(xué)研究中的實(shí)際應(yīng)用價(jià)值。一種緩解該問(wèn)題的方法是利用 LLM 生成基于 Lean 等語(yǔ)言的正式證明。DeepMind 對(duì)該方法解決「開放性問(wèn)題」的能力進(jìn)行了首次大規(guī)模評(píng)估,其智能體自主解決了 353 個(gè) Erd?s 開放性問(wèn)題中的 9 個(gè),且解決每個(gè)問(wèn)題的成本僅為數(shù)百美元;此外,它還證明了 OEIS 數(shù)據(jù)庫(kù)中 492 個(gè)猜想中的 44 個(gè),目前正被應(yīng)用于組合學(xué)、優(yōu)化理論、圖論、代數(shù)幾何及量子光學(xué)等領(lǐng)域的研究中。

      這些研究發(fā)現(xiàn)不僅充分展示了人工智能輔助正式證明搜索技術(shù)的強(qiáng)大潛力,同時(shí)也為實(shí)現(xiàn)此類能力的智能體架構(gòu)設(shè)計(jì)提供了重要的啟示。

      「Erd?s 問(wèn)題」通常不是指某一道單一的數(shù)學(xué)題,而是指由 20 世紀(jì)最具影響力的匈牙利數(shù)學(xué)家保羅·埃爾德什(Paul Erd?s)一生中提出的大量數(shù)學(xué)問(wèn)題與猜想。他留下了數(shù)百個(gè)經(jīng)典的數(shù)學(xué)難題,主要集中在數(shù)論、組合數(shù)學(xué)和幾何等領(lǐng)域。

      現(xiàn)代組合學(xué)與數(shù)論的許多分支,正是在嘗試解決這些問(wèn)題的過(guò)程中建立起來(lái)的。從素?cái)?shù)間隙到偏差理論,可以說(shuō)這些問(wèn)題塑造了整個(gè)學(xué)科領(lǐng)域。

      那么,DeepMind 的 AI 是如何破解這些問(wèn)題的?

      方法

      DeepMind 此次推出的框架名為AlphaProof Nexus。它的核心邏輯是:將大模型天馬行空的「創(chuàng)造力」與 Lean 編譯器絕對(duì)嚴(yán)謹(jǐn)?shù)摹概袆e力」結(jié)合起來(lái)。



      配備 AlphaProof 的智能體的輸入/輸出示例(應(yīng)用于 Erd?s #125 問(wèn)題)。

      在這個(gè)框架下,人類數(shù)學(xué)家只需輸入一個(gè)帶有占位符(把證明部分留空,寫上 sorry 占位符,即待證明部分)的代碼草圖,并用特殊的標(biāo)記(如 EVOLVE-BLOCK 或 EVOLVE-VALUE)圈出范圍,告訴 AI 哪些地方可以動(dòng),接下來(lái)就讓智能體接管后續(xù)工作。解決問(wèn)題的宏觀戰(zhàn)略規(guī)劃、微觀邏輯推導(dǎo)、引理創(chuàng)建甚至參數(shù)微調(diào),全部交由 AI 閉環(huán)自主完成。

      研究團(tuán)隊(duì)設(shè)計(jì)了兩種核心的智能體架構(gòu),而這兩種架構(gòu)的對(duì)比,揭示了當(dāng)前 AI 發(fā)展的一個(gè)重要趨勢(shì):

      • 基礎(chǔ)智能體:思考 - 嘗試循環(huán)

      這是一種簡(jiǎn)約的架構(gòu)。系統(tǒng)啟動(dòng)多個(gè)無(wú)共享狀態(tài)的子智能體獨(dú)立運(yùn)行。每個(gè)子智能體內(nèi)部是一個(gè)多輪交互循環(huán):底層模型(Gemini 3.1 Pro)通過(guò)「思考鏈」推理,調(diào)用搜索和替換工具修改代碼草圖。每次修改后,Lean 編譯器會(huì)立即進(jìn)行驗(yàn)證;如果報(bào)錯(cuò),模型就利用報(bào)錯(cuò)信息進(jìn)行自我反思和修正,不斷循環(huán),直到所有證明漏洞被填補(bǔ)。

      • 全功能智能體:引入 AlphaProof

      除了上述的基礎(chǔ)循環(huán),研究人員還引入了受 AlphaEvolve 啟發(fā)的多智能體演化算法。他們讓另一個(gè)大模型(Gemini 3.0 Flash)充當(dāng)「裁判」,對(duì)生成的證明草圖進(jìn)行清晰度、合理性和新穎性的 Elo 評(píng)分,從而引導(dǎo)系統(tǒng)在龐大的可能性庫(kù)中進(jìn)行優(yōu)勝劣汰的采樣。此外,該架構(gòu)還能調(diào)用專門針對(duì)奧數(shù)級(jí)別問(wèn)題進(jìn)行過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的 AlphaProof 作為輔助求解工具。



      全功能 AlphaProof Nexus 智能體的設(shè)計(jì)。

      直覺上,全功能智能體應(yīng)該全面碾壓基礎(chǔ)架構(gòu)。但事后分析顯示,極其簡(jiǎn)單的「基礎(chǔ)智能體」同樣成功解出了所有 9 道埃爾德什難題。研究團(tuán)隊(duì)明確指出,隨著底層大模型(如 Gemini 3.1 Pro)自身智能密度的不斷躍升,簡(jiǎn)單的智能體交互循環(huán)正在展現(xiàn)出驚人的效能。這預(yù)示著,在絕對(duì)客觀的編譯器反饋錨定下,工業(yè)界可能會(huì)逐漸從構(gòu)建高度特化、復(fù)雜的訓(xùn)練系統(tǒng),轉(zhuǎn)向直接利用通用大模型的原生推理能力。

      哪 9 個(gè) Erd?s 問(wèn)題?



      問(wèn)題 12 (i) —— 避免整除的密集整數(shù)集(1970 年提出)

      該問(wèn)題探討是否存在一個(gè)包含無(wú)窮多個(gè)正整數(shù)的集合,在這個(gè)集合中,沒(méi)有任何一個(gè)數(shù)字可以整除另外兩個(gè)更大數(shù)字的和。同時(shí),這個(gè)集合在整個(gè)正整數(shù)范圍內(nèi)還要保持足夠的「密集度」(滿足特定的下密度下限)。AI 通過(guò)巧妙融合中國(guó)剩余定理與避免特定算術(shù)級(jí)數(shù)的構(gòu)造法,給出了肯定的證明。

      問(wèn)題 12 (ii) —— 避免整除的更高密度極限(1970 年提出)

      這是上一題的加強(qiáng)版,要求構(gòu)造的集合在滿足「不整除」條件的同時(shí),擁有逼近極限的超高密度。AI 運(yùn)用 Behrend 風(fēng)格的構(gòu)造法,在極其苛刻的約束下找到了滿足條件的無(wú)窮集合,從而一舉終結(jié)了這兩個(gè)長(zhǎng)達(dá)半個(gè)多世紀(jì)的懸案。

      問(wèn)題 125 —— 不同進(jìn)制數(shù)字集合的加和密度(1996 年提出)

      想象兩個(gè)特殊的數(shù)字集合:一個(gè)只用 0 和 1 構(gòu)成的三進(jìn)制數(shù)字組成,另一個(gè)只用 0 和 1 構(gòu)成的四進(jìn)制數(shù)字組成。將這兩個(gè)集合里的數(shù)字兩兩相加形成一個(gè)新集合,這個(gè)新集合的數(shù)字分布頻率(下密度)是否大于零?AI 利用丟番圖逼近原理,證明了隨著數(shù)字規(guī)模的擴(kuò)大,其分布密度會(huì)不斷被稀釋,最終嚴(yán)格證明其下密度為零。

      問(wèn)題 138(變體)—— 顏色與數(shù)列的間隔極限(1981 年提出)

      這個(gè)問(wèn)題與范德瓦爾登數(shù)有關(guān),它描述的是在對(duì)連續(xù)整數(shù)進(jìn)行染色時(shí),為了保證一定能找到同色的等差數(shù)列,所需整數(shù)序列的最小長(zhǎng)度。AI 采用貪心染色擴(kuò)展算法結(jié)合局部矛盾分析,證明了隨著等差數(shù)列長(zhǎng)度要求的增加,這些范德瓦爾登數(shù)之間的間隔會(huì)趨于無(wú)窮大。

      問(wèn)題 152 —— 西頓集中的孤立點(diǎn)(1994 年提出)

      西頓集是一種特殊的數(shù)字集合,其中任意兩對(duì)數(shù)字的和都不相等。問(wèn)題探討當(dāng)這種集合足夠大時(shí),其兩兩相加得到的新集合中,是否包含大量的「孤立點(diǎn)」(即該數(shù)字的相鄰數(shù)字不在該集合中)。AI 通過(guò)對(duì)內(nèi)部點(diǎn)、偏移鄰居等進(jìn)行細(xì)致的邊界分析,給出了證明。

      問(wèn)題 741 (i) —— 集合拆分后的加和密度(1994 年提出)

      如果一個(gè)集合與自身相加產(chǎn)生的新集合在自然數(shù)中占據(jù)了可觀的比例(具備正的上密度),那么我們能否把原來(lái)的集合一分為二,使得這兩半各自與自身相加產(chǎn)生的新集合,依然都能占據(jù)可觀的比例?AI 給出了肯定的答案。

      問(wèn)題 741 (ii) —— 集合拆分與間隙界限(1994 年提出)

      與上一題相關(guān),AI 證明了存在一種極其特殊的「二階基」集合,這種集合包含了一種「禁區(qū)」結(jié)構(gòu)。無(wú)論你如何將它一分為二,這兩個(gè)子集各自相加生成的新集合中,至少有一個(gè)必定會(huì)出現(xiàn)無(wú)限擴(kuò)大的數(shù)字?jǐn)鄬樱o(wú)法保持有界間隙)。

      問(wèn)題 846 —— 平面點(diǎn)集的幾何悖論(1992 年提出)

      這是一個(gè)關(guān)于平面幾何的奇妙問(wèn)題。AI 證明了存在這樣一種無(wú)限擴(kuò)展的平面點(diǎn)集:你從中任意挑出有限個(gè)點(diǎn),總能發(fā)現(xiàn)其中有很大一部分是不共線的(即沒(méi)有三個(gè)點(diǎn)在同一條直線上)。然而,整個(gè)無(wú)限集合卻無(wú)論如何也無(wú)法被拆分成有限個(gè)「絕對(duì)沒(méi)有三點(diǎn)共線」的子集。

      問(wèn)題 26(延伸變體)—— 整數(shù)倍數(shù)密度的極值(1995 年提出)

      這探討了整數(shù)倍數(shù)在自然數(shù)系中的分布規(guī)律。AI 通過(guò)精妙的迭代構(gòu)造(利用不斷增加的素?cái)?shù)序列),證明了存在一種特定的正整數(shù)序列,當(dāng)你把這個(gè)序列中的所有數(shù)字都加上任意一個(gè)相同的正整數(shù)偏移量后,這些新數(shù)字生成的所有倍數(shù),其在自然數(shù)中的占比永遠(yuǎn)會(huì)被嚴(yán)格限制在一個(gè)上限(小于四分之三)之下。

      在 DeepMind 的實(shí)踐中,大模型在不同問(wèn)題上的計(jì)算開銷差異巨大,絕大多數(shù)問(wèn)題的平均成本在幾十美元到幾百美元之間,最「便宜」的問(wèn)題僅需 7.5-15 美元。

      看起來(lái)也沒(méi)比 AI 寫代碼貴太多?

      我們知道,上個(gè)星期 OpenAI 剛剛宣布使用內(nèi)部通用推理模型推翻了數(shù)學(xué)界近 80 年的「平面單位距離猜想」(Erd?s Unit Distance Problem),再加上此次 DeepMind 提交的成果,一系列進(jìn)步標(biāo)志著大模型的能力和應(yīng)用范式正在發(fā)生改變。

      現(xiàn)在 AI 能夠解決的問(wèn)題,已是真正的數(shù)學(xué)開放性未知領(lǐng)域,它們面對(duì)人類數(shù)學(xué)家也沒(méi)有探索完成的「無(wú)人區(qū)」,正在自主創(chuàng)造新知識(shí)。

      科學(xué)發(fā)現(xiàn)的速度正在快速走向指數(shù)化。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      中國(guó)國(guó)民黨主席鄭麗文正訪問(wèn)美國(guó),外交部回應(yīng)

      中國(guó)國(guó)民黨主席鄭麗文正訪問(wèn)美國(guó),外交部回應(yīng)

      澎湃新聞
      2026-06-02 15:26:26
      鄧紫棋何超蓮久違同框!18歲相識(shí)的神仙閨蜜,慶生曬合照甜度爆表

      鄧紫棋何超蓮久違同框!18歲相識(shí)的神仙閨蜜,慶生曬合照甜度爆表

      觀魚聽雨
      2026-06-01 23:23:38
      驚掉下巴!女生索要9000元換手機(jī),男友轉(zhuǎn)賬附上“以結(jié)婚為目的”

      驚掉下巴!女生索要9000元換手機(jī),男友轉(zhuǎn)賬附上“以結(jié)婚為目的”

      火山詩(shī)話
      2026-06-02 16:32:30
      夏補(bǔ)鉀,不疲憊,建議大家:夏天多吃這3種“補(bǔ)鉀高手”,精神好

      夏補(bǔ)鉀,不疲憊,建議大家:夏天多吃這3種“補(bǔ)鉀高手”,精神好

      阿龍美食記
      2026-05-31 20:23:07
      唐山貨車司機(jī)大熱天捎七旬老人40公里,臨下車?yán)先送蝗蛔兡樣炲X

      唐山貨車司機(jī)大熱天捎七旬老人40公里,臨下車?yán)先送蝗蛔兡樣炲X

      聽心堂
      2026-06-02 12:03:05
      “辦案人員篡改偽造證人筆錄,沒(méi)被追責(zé)還升職了”,云南鎮(zhèn)雄公安局原副局長(zhǎng)刑滿出獄后公開舉報(bào)

      “辦案人員篡改偽造證人筆錄,沒(méi)被追責(zé)還升職了”,云南鎮(zhèn)雄公安局原副局長(zhǎng)刑滿出獄后公開舉報(bào)

      大風(fēng)新聞
      2026-06-02 19:35:11
      “割四賠五”風(fēng)波升級(jí):多家派出所介入,網(wǎng)紅出面也無(wú)力扭轉(zhuǎn)局面

      “割四賠五”風(fēng)波升級(jí):多家派出所介入,網(wǎng)紅出面也無(wú)力扭轉(zhuǎn)局面

      北緯的咖啡豆
      2026-06-01 19:33:09
      5月29日新華社一份數(shù)據(jù)曝光,開2噸以上新能源車的車主集體失眠

      5月29日新華社一份數(shù)據(jù)曝光,開2噸以上新能源車的車主集體失眠

      音樂(lè)時(shí)光的娛樂(lè)
      2026-05-31 12:26:42
      浙江廣廈主帥:G4無(wú)論結(jié)果如何都要拼到最后一刻

      浙江廣廈主帥:G4無(wú)論結(jié)果如何都要拼到最后一刻

      北青網(wǎng)-北京青年報(bào)
      2026-06-02 13:50:14
      太諷刺了!女方提出28.8萬(wàn)元彩禮要求,男子送來(lái)一瓣蒜和百元現(xiàn)金

      太諷刺了!女方提出28.8萬(wàn)元彩禮要求,男子送來(lái)一瓣蒜和百元現(xiàn)金

      火山詩(shī)話
      2026-06-02 07:25:54
      炸裂!捐精有多亂,雙方直接在賓館完成懷孕過(guò)程,一次八百到幾萬(wàn)

      炸裂!捐精有多亂,雙方直接在賓館完成懷孕過(guò)程,一次八百到幾萬(wàn)

      就一點(diǎn)
      2026-06-02 15:45:51
      一公務(wù)員被指玩弄女性感情,兩米多高易拉寶擺放在財(cái)政局門外,佛山市財(cái)政局回應(yīng)

      一公務(wù)員被指玩弄女性感情,兩米多高易拉寶擺放在財(cái)政局門外,佛山市財(cái)政局回應(yīng)

      深圳晚報(bào)
      2026-06-02 14:20:18
      在與俄領(lǐng)導(dǎo)人會(huì)面后,俄羅斯寡頭們“自愿”為戰(zhàn)爭(zhēng)捐款2200億盧布

      在與俄領(lǐng)導(dǎo)人會(huì)面后,俄羅斯寡頭們“自愿”為戰(zhàn)爭(zhēng)捐款2200億盧布

      山河路口
      2026-06-02 14:04:22
      杭州限狗令正式落地,養(yǎng)狗人月花上千,憑什么讓不養(yǎng)狗的人買單?

      杭州限狗令正式落地,養(yǎng)狗人月花上千,憑什么讓不養(yǎng)狗的人買單?

      奇思妙想草葉君
      2026-06-01 19:40:34
      師父來(lái)了!文班亞馬的靠山,真TM硬啊!

      師父來(lái)了!文班亞馬的靠山,真TM硬啊!

      左右為籃
      2026-06-02 09:06:29
      收割機(jī)空車北返,麥田里沒(méi)人說(shuō)話,信任這東西碎了就難粘回去

      收割機(jī)空車北返,麥田里沒(méi)人說(shuō)話,信任這東西碎了就難粘回去

      網(wǎng)絡(luò)易不易
      2026-06-02 14:40:09
      挪威深海發(fā)現(xiàn)載有中國(guó)瓷器的18世紀(jì)沉船:大量青花瓷碗重見天日,文物達(dá)數(shù)千件,目前正開展船只溯源工作并努力還原歷史真相

      挪威深海發(fā)現(xiàn)載有中國(guó)瓷器的18世紀(jì)沉船:大量青花瓷碗重見天日,文物達(dá)數(shù)千件,目前正開展船只溯源工作并努力還原歷史真相

      大風(fēng)新聞
      2026-06-02 12:15:18
      離譜!中山大學(xué)一寢室月用近900度電,電費(fèi)573元!學(xué)生透露:學(xué)校已刪賬單

      離譜!中山大學(xué)一寢室月用近900度電,電費(fèi)573元!學(xué)生透露:學(xué)校已刪賬單

      輝哥說(shuō)動(dòng)漫
      2026-06-02 18:23:33
      當(dāng)不成總統(tǒng)了?特朗普體檢報(bào)告出來(lái)了,快80歲的他,恐被迫下臺(tái)

      當(dāng)不成總統(tǒng)了?特朗普體檢報(bào)告出來(lái)了,快80歲的他,恐被迫下臺(tái)

      走進(jìn)事件的中心
      2026-06-02 11:19:55
      血壓飆升!上海父親曬聊天記錄,“巨嬰”兒子強(qiáng)行索要2萬(wàn)旅游費(fèi)

      血壓飆升!上海父親曬聊天記錄,“巨嬰”兒子強(qiáng)行索要2萬(wàn)旅游費(fèi)

      火山詩(shī)話
      2026-06-02 14:27:07
      2026-06-02 20:11:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      13151文章數(shù) 142660關(guān)注度
      往期回顧 全部

      科技要聞

      燒掉千億后,美團(tuán)、阿里、京東誰(shuí)先止血?

      頭條要聞

      小學(xué)教師疑因打井糾紛殺害鄰居 死者留下兩未成年兒子

      頭條要聞

      小學(xué)教師疑因打井糾紛殺害鄰居 死者留下兩未成年兒子

      體育要聞

      1米74的業(yè)余聯(lián)賽替補(bǔ),在英超踢中衛(wèi)

      娛樂(lè)要聞

      奚夢(mèng)瑤何猷君補(bǔ)辦婚禮超幸福

      財(cái)經(jīng)要聞

      智元和宇樹的“暗戰(zhàn)”愈演愈烈

      汽車要聞

      星途神秘新車輪廓曝光 又一款性能SUV要來(lái)了?

      態(tài)度原創(chuàng)

      藝術(shù)
      本地
      數(shù)碼
      公開課
      軍事航空

      藝術(shù)要聞

      周杰倫花 1.36 億拍下這幅畫

      本地新聞

      用剪紙的方式,打開江蘇揚(yáng)州

      數(shù)碼要聞

      華為nova 16系列發(fā)布:2999元起 全系配備后置紅楓原色鏡頭

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗媒體新發(fā)布最高領(lǐng)袖照片

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 人人妻人人爽人人狠狠| 好日子在线观看视频大全免费动漫| 激情一区二区三区视频| 中文日韩人妻| 成a人片亚洲日本久久| 亚洲国产美女精品久久久| 色狠狠色噜噜AV一区| 国产精品美女一区二三区| 成人午夜污污在线观看网站 | 一区二区三区国产99| 九九免费视频| 97久久综合亚洲色hezyo| 国产精品亚洲mnbav网站| 91国内外精品自在线播放| 亚洲精品有码在线观看| 岛国av免费观看| 亚洲午夜香蕉久久精品| 国内不卡的一区二区三区| 97精品国产91久久久久久久| 中文字幕亚洲在线观看| 99噜噜噜在线播放| 日日摸日日添日日躁| 久久夜精品综合缴情五月| 亚洲天堂在线99| 亚洲人成网站18禁止无码| 四虎女优在线视频免费看| 亚洲丝袜熟女| 日本丰满少妇高潮呻吟| 性无码视频在线播放| 中文字幕人成乱码熟女免费| 国产盗摄人妻精品一区| 99久久久国产精品免费无卡顿| 性姿势真人免费视频放| 久久水蜜桃亚洲av无码精品麻豆| 久久精品人妻无码白浆| 黄色三级小说| 亚洲一区二区三区在线观看播放| 午夜天堂精品久久久久| 粉嫩蜜臀av一区二区绯色| 狠狠色噜噜狠狠狠狠777米奇| 午夜国产高清精品一区免费|