<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      留給人類數學家的懸賞不多了!谷歌DeepMind解決9道埃爾德什問題

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      AI進軍數學界的速度太快了。

      OpenAI前腳剛用內部模型突破埃爾德什的80年單位距離問題,谷歌DeepMind后腳就解決一個同樣卡了人類56年的埃爾德什數學難題——

      最新發布AlphaProof Nexus,一套由Gemini驅動的智能體框架,一出手就是9個埃爾德什開放問題



      除了這9道,它還順手證明了OEIS整數序列百科里的44個猜想、搞定了一道擱置15年的代數幾何難題、還改進了凸優化領域里一個沿用已久的理論邊界。

      推理成本呢?每道題幾百美元,整套證明代碼也全都開源放在了GitHub上。



      這篇論文共有20位作者,其中的Aja Huang,也是2016年AlphaGo的核心研究員。

      56年沒人做出來的題,AI 給了什么答案

      AlphaProof Nexus解決的這幾道題,咱挑三道最有意思的說說。

      Erd?s#12,1970年提出,懸置56年

      這道題問的是:你能不能找出一個無限大的整數集合,滿足兩個聽起來很別扭的條件:

      第一,任意從中挑三個不同的數字a、b、c,a永遠不能整除b加c的和。

      第二,這組數不能太零散,在自然數里要保持一定的密度。

      簡單理解就是,這群數字之間,既不能一個數整除另一個數,也不能一個數整除另外兩個數的和,同時數字還要分布得相對密集,不能只挑寥寥幾個數投機取巧。

      從1970年開始,就沒人能給出這個集合的完整構造,各種局部進展有,但始終拼不成一個整體解。



      AI的解法是用中國剩余定理把大問題拆成許多個獨立的區塊,每個區塊內部用三項等差數列的回避集來滿足約束,然后把所有區塊拼回一個完整的無限集。



      Erd?s#125,1996年提出,30年沒有定論

      這道題聽著就更奇怪了。

      想象兩個數字集合:第一個集合里全是“在三進制下只由數字0和1組成的整數”,第二個集合里全是“在四進制下只由數字0和1組成的整數”。把這兩個集合里所有數字兩兩相加,得到一個新集合。

      問:這個新集合里的數字在自然數中出現的頻率(數學上叫下密度)是不是正的?

      直覺上你可能會覺得,兩種集合包含的數字本來就不算很多,加起來應該也挺稀疏的。

      但稀疏到什么程度?是徹底稀到密度歸零,還是多少保持一點正密度?

      這中間的差別非常微妙,1996年提出后一直沒定論。

      AI的答案是:密度為零。



      證明思路是log?除以log?是無理數。這意味著3的冪次和4的冪次可以以任意精度彼此逼近。

      利用這一點,AI構造了一個歸納性稀疏化論證:不斷找到兩個幾乎對齊的尺度,讓密度以0.99的比率一步步衰減,直到徹底歸零。

      一個純數論的性質,解決了一個組合幾何的問題。

      Erd?s#846,1992年提出,卡了人類34年。

      這是個平面幾何題,AI證明了存在這樣一個無限擴展的平面點集:

      你從中任意挑出有限個點,總能發現其中大部分點是不共線的——

      隨便截一段,看起來都挺正常,但當你試圖把這個無限集合拆分成有限個“絕對沒有任何三點共線”的子集時,辦不到。

      一個集合的每個有限局部都正常,但整體頑固得不可拆分。這種全局與局部的張力,是組合幾何里最難的那一類問題。

      AI把完全圖的每條邊映射到平面上一個點,用二次多項式編碼坐標,再拉上無窮Ramsey定理完成證明,把一個幾何問題翻譯成了圖論和邏輯的語言。

      除了這三道,還有六道分別在整除集構造、范德瓦爾登數間隙、西頓集孤立點、集合拆分密度等領域。



      同時,AlphaProof Nexus還在OEIS整數序列百科里證明了44個開放猜想,在代數幾何那邊解決了一道希爾伯特函數對數凹性的15年懸案,凸優化那邊改進了一個錨定梯度下降法的理論邊界。



      菲爾茲獎得主陶哲軒曾經提醒過,AI目前解決埃爾德什問題的實際成功率大約在1-2%,這次谷歌的系統挑戰了353道題,解開9道,比例剛好對上了。

      用幾百美元算力換一道56年難題

      AlphaProof Nexus的架構核心用一句話就能說清楚,Gemini 3.1 Pro生成Lean語言證明步驟→Lean編譯器逐行檢查→報錯直接反饋給模型→模型根據報錯修改→再檢查→循環到全部通過。



      好家伙,這有點像平時寫代碼,只不過現在Debug的是數學定理……



      在這套框架里,DeepMind設計了四個Agent

      最簡單的Agent A是同時啟動多個獨立子Agent,先靠Gemini 3.1 Pro梳理解題思路,動手編寫證明代碼。

      寫完立刻交給編譯器核驗,一旦報錯,錯誤信息就會傳回模型,讓它不斷修改、重試,直到通關。

      全程沒有額外輔助工具,純靠寫代碼+查錯循環。



      Agent B多了一樣東西,AlphaProof。

      AlphaProof是DeepMind之前專門為奧數級別題目訓練過的強化學習證明工具。

      當Agent A模式在某個小步驟上反復卡住、編譯器反復報錯也修不過來時,Agent B可以調用AlphaProof做一次強化學習驅動的樹搜索,專門攻擊這個局部難點。

      Agent C引入了進化算法的思路。

      前面兩種Agent的子Agent都是各自獨立工作的,互不交流。

      Agent C是所有子Agent共享一個證明草圖種群,每一個子模塊都會產出不同的證明草稿。

      然后由另一個模型從合理性、清晰度、新穎性三個維度給每一份草稿打分,用Elo評分系統排名。

      高分草稿會相互組合,衍生出新解法,低分草稿直接淘汰,整個種群在證明空間里做進化搜索。

      Agent D是全功能完全體,進化篩選思路+專項工具攻克難點+大模型邏輯推理,三股力量在一個框架里協同,也是這次批量破解難題的主力。



      這么看下來,我以為最強的Agent D應該會碾壓一切,Agent A只當個對照組。

      結果沒想到論文里表明最簡單的Agent A,同樣能解出全部9道題

      沒有進化算法,沒有AlphaProof,就一個LLM循環加編譯器反饋的Agent A,只是在難題上更費錢一點。



      研究團隊把原因歸為兩個:

      • 一是Gemini 3.1 Pro本身的能力已經足夠強了;
      • 二是Lean編譯器的那層實打實的糾錯反饋,對AI的引導作用,遠比人們預想的更大。

      這個結果或許也在預示著,未來隨著大模型能力持續升級,復雜的多工具組合系統,可能不再是剛需,只用大模型+專業校驗工具這套簡單循環,就能搞定大多數數學難題。

      而且這套方案的優勢也體現在成本上,單題僅需幾百美元。

      埃爾德什生前為這些難題設置了懸賞,只是他不會想到——

      解開這些謎題的可能不是人類智慧,而是算力。

      論文地址:https://arxiv.org/abs/2605.22763v1
      Github地址:https://github.com/google-deepmind/alphaproof-nexus-results


      [1]https://x.com/pushmeet/status/2058936037754224998
      [2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      襄陽“割四賠五”后續:23家派出所出手,網紅出面也無力扭轉局面

      襄陽“割四賠五”后續:23家派出所出手,網紅出面也無力扭轉局面

      觀察鑒娛
      2026-05-31 19:01:32
      印尼左右為難,22天后想悄悄松手,結果發現趕走國人產業就崩了!

      印尼左右為難,22天后想悄悄松手,結果發現趕走國人產業就崩了!

      聞識
      2026-06-01 04:34:45
      這對文玩核桃有200年歷史?各位上眼吧

      這對文玩核桃有200年歷史?各位上眼吧

      鴻璐宣
      2026-05-31 12:05:03
      俄烏戰爭,如果俄羅斯最終贏了,你我在有生之年很可能會親歷戰爭

      俄烏戰爭,如果俄羅斯最終贏了,你我在有生之年很可能會親歷戰爭

      混沌錄
      2026-05-29 23:26:12
      35頁PPT瘋傳:洛陽女子1女談3男,每天卡時間,都已談婚論嫁

      35頁PPT瘋傳:洛陽女子1女談3男,每天卡時間,都已談婚論嫁

      烈史
      2026-05-30 13:23:41
      界面調查|起底留神峪煤礦及實控人任鐵柱:草根出身,煤改中幸存,管理混亂釀成大禍

      界面調查|起底留神峪煤礦及實控人任鐵柱:草根出身,煤改中幸存,管理混亂釀成大禍

      界面新聞
      2026-05-31 16:40:39
      250億元,賴清德偷竄代價曝光,島內批:為牟取政治利益“自甘下跪”

      250億元,賴清德偷竄代價曝光,島內批:為牟取政治利益“自甘下跪”

      環球網資訊
      2026-06-01 06:36:08
      做好事還是做壞事?男子丟了手機獻完血順走護士手機,民警12小時內將其抓獲

      做好事還是做壞事?男子丟了手機獻完血順走護士手機,民警12小時內將其抓獲

      大風新聞
      2026-06-01 10:51:03
      鄧正紅軟實力哲學:物質奇點的“無限悖論”違背物理世界基本規則

      鄧正紅軟實力哲學:物質奇點的“無限悖論”違背物理世界基本規則

      鄧正紅軟實力
      2026-06-01 11:50:57
      鬧笑話了!黃仁勛攤牌:看不上華為韜定律,卻被業內專家說不專業

      鬧笑話了!黃仁勛攤牌:看不上華為韜定律,卻被業內專家說不專業

      兵鑒史
      2026-05-30 14:32:11
      女子嫌丈夫懷疑她出軌,只能讓情夫殺了丈夫,2008年可憐了2個娃

      女子嫌丈夫懷疑她出軌,只能讓情夫殺了丈夫,2008年可憐了2個娃

      漢史趣聞
      2026-05-31 15:41:25
      成人網紅邦妮自曝惡心計劃:6月辦尿淋派對,粉絲可尿她發生關系

      成人網紅邦妮自曝惡心計劃:6月辦尿淋派對,粉絲可尿她發生關系

      赴一場山海啊
      2026-06-01 00:27:25
      6-2!巴西大輪換仍橫掃世界杯參賽隊,皇馬1.5億巨星傳射+世界波

      6-2!巴西大輪換仍橫掃世界杯參賽隊,皇馬1.5億巨星傳射+世界波

      我愛英超
      2026-06-01 07:34:53
      Lisa懷了驢老三的孩子!?

      Lisa懷了驢老三的孩子!?

      八卦瘋叔
      2026-06-01 10:27:11
      急需重建!廣廈0-3脆敗上海,隊友內訌曝光,三大拖油瓶藏不住了

      急需重建!廣廈0-3脆敗上海,隊友內訌曝光,三大拖油瓶藏不住了

      八斗小先生
      2026-06-01 11:36:36
      女子蹭卡進山姆待一天,有吃有喝空調還能吹到飽

      女子蹭卡進山姆待一天,有吃有喝空調還能吹到飽

      映射生活的身影
      2026-05-31 21:37:09
      韓國談抗美援朝:超400萬人犧牲,中國并非援助,而是戰爭主力!

      韓國談抗美援朝:超400萬人犧牲,中國并非援助,而是戰爭主力!

      興趣知識
      2026-05-31 00:56:50
      百萬網紅邊牧被賣后續!母親崩潰怒斥,當事人放話,收狗人曝內情

      百萬網紅邊牧被賣后續!母親崩潰怒斥,當事人放話,收狗人曝內情

      奇思妙想草葉君
      2026-05-30 22:22:07
      襄陽割四賠五新后續:大批麥客連夜撤走,當地部門緊急出手整改

      襄陽割四賠五新后續:大批麥客連夜撤走,當地部門緊急出手整改

      奇思妙想草葉君
      2026-05-31 23:01:42
      張雪機車收獲兩個第8名,張雪發文反對車手德比斯攬責:“知道短板了就改進,相信下一代賽車更強”

      張雪機車收獲兩個第8名,張雪發文反對車手德比斯攬責:“知道短板了就改進,相信下一代賽車更強”

      都市快報橙柿互動
      2026-06-01 08:57:58
      2026-06-01 13:36:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12720文章數 176476關注度
      往期回顧 全部

      科技要聞

      關停三年后,天涯社區今起開放訪問

      頭條要聞

      普京將烏無人機殘骸交于美方 被指發表"極其危險言論"

      頭條要聞

      普京將烏無人機殘骸交于美方 被指發表"極其危險言論"

      體育要聞

      哭過之后,文班亞馬想給波波維奇打電話

      娛樂要聞

      張凌赫活動商場玻璃被擠爆5人受傷

      財經要聞

      網紅驅蚊產品,標注化妝品竟含農藥成分

      汽車要聞

      上市三周交付3603臺!華境S躋身旗艦大六座第一梯隊

      態度原創

      本地
      家居
      數碼
      教育
      公開課

      本地新聞

      用剪紙的方式,打開江蘇揚州

      家居要聞

      自信舒展 高背座椅

      數碼要聞

      英特爾推出Intel 18A制程首款數據中心CPU至強6+處理器

      教育要聞

      廣東財經大學:值得填報嗎?熱門專業就業現狀及報考分析#搜索千校視頻計劃

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产人成无码视频在线观看| 国产午夜视频在线观看| 免费人成视频在线视频电影| 日韩有码av中文字幕| 精品婷婷色一区二区三区| 亚洲aⅴ久久久噜噜噜噜| 国产99青青成人A在线| 亚洲永久一区二区三区在线 | 中文字幕无码人妻| 日韩V欧美V中文在线| 国产乱码精品一区二区上| 67194欧洲| 老司机性色福利精品视频| 超级黄色a毛片视频| 亚洲精品午夜天堂网页| 欧美xxxxx在线观看| 色道久久综合亚洲精品蜜桃| 亚洲色大成网站WWW久久| 中文精品字幕人妻熟女| www亚洲无码| 五月天婷婷在在线视频| 久久精品94精品久久精品动漫| 久久久久久久久久久久中文字幕 | 粗壮挺进人妻水蜜桃成熟| 欧美精品1卡二卡三卡四卡| 国产经典免费视频在线观看| 黄色在线免费观看| 制服丝袜国产精品| 亚洲精品www久久久久久| 日本道精品一区二区三区| 99精品久久久久久久婷婷| 色综合久久88色综合天天99男人| 久久99精品久久久久麻豆| av最新版天堂在资源在线| 性欧美暴力猛交69hd| 内射老阿姨1区2区3区4区| 超碰人人摸| 国产av剧情无码精品色午夜| 国产精品久久久久久白浆色欲| 国产哺乳奶水91在线播放| 国模国产精品嫩模大尺度视频 |