![]()
智東西
作者 王涵
編輯 云鵬
智東西6月12日報道,今天,在智源大會2026上,智源研究院分享并發(fā)布了近一年以來的多項研究成果,包括基座大模型、智能體和基礎軟硬件生態(tài)三部分。
基座大模型方面,智源分享了原生多模態(tài)大模型悟界Emu3.5、AI藥物發(fā)現(xiàn)模型悟界·OpenComplex 2.5等的研究進展,并在會上發(fā)布了神經(jīng)科學模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經(jīng)科學領域數(shù)據(jù)集,以及全球最大的AI-Ready神經(jīng)科學數(shù)據(jù)平臺BrainToken。
![]()
智能體方面,智源進一步介紹了其具身大腦悟界·RoboBrain Orca v0,發(fā)布了四款智能體產(chǎn)品,包括面向心臟疾病的輔助診斷智能體、面向科學發(fā)現(xiàn)的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎軟硬件生態(tài)方面,智源發(fā)布眾智FlagOS 2.1,該系統(tǒng)能夠適配18家芯片廠商的32款芯片。
在大會開幕演講中,美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出:當前依賴反饋控制的方法效果不佳,他主張形式化方法才是未來,即先明確形式化規(guī)范、再編寫程序、最后數(shù)學證明程序符合規(guī)范,他樂觀認為未來AI將成為完成這些證明的工具,大幅提升可靠性。演講尾聲,Diffie給出驚人預測:到2050年,機器智能將超越人類,成為世界運行的主宰。
![]()
圖靈獎得主、馬薩諸塞大學阿默斯特分校榮譽退休教授Andrew Barto,將強化學習歸結為“控制、搜索與聯(lián)想記憶”的三位一體,指出“機器學習最初就是強化學習”。他強調(diào)強化學習與神經(jīng)網(wǎng)絡研究從一開始便緊密交織,深度強化學習結合大腦獎勵系統(tǒng)的最新成果將指引下一輪方向。最后他警示:獎勵信號設計可能帶來“反常實例化”風險。
![]()
在播客環(huán)節(jié),中國工程院院士、阿里云創(chuàng)始人王堅與智源研究院理事長黃鐵軍展開對話,圍繞中國大模型的發(fā)展路徑展開,重點討論了從追趕驗證到路線選擇、體系構建與范式創(chuàng)新的轉(zhuǎn)型,如何突破互聯(lián)網(wǎng)文本數(shù)據(jù)的天花板和算力短缺的極限,以及如何從“跟隨國際主流范式”轉(zhuǎn)向“形成自身問題意識”、實現(xiàn)原創(chuàng)范式躍遷。
![]()
在智源研究院院長王仲遠主持的圓桌對話中,小米羅福莉、清華朱軍、清華劉知遠、南洋理工安波四位專家進行了近50分鐘的深度交流。
羅福莉認為引發(fā)熱議的Claude Fable 5本質(zhì)仍是預訓練、數(shù)據(jù)與強化學習持續(xù)推進的自然結果;朱軍指出新版模型Token消耗下降是正確方向;劉知遠分析Anthropic的成功源于找準代碼這一專業(yè)領域,并強調(diào)智能革命在于用AI替代機械重復的腦力勞動;安波則提出AI自進化不能依賴封閉環(huán)境。
![]()
一、“悟界”登《Nature》,發(fā)布全球最大最全的神經(jīng)科學數(shù)據(jù)集
智源研究院院長王仲遠分享了近一年來智源研究院的相關研究進展。
基座大模型方面,智源研發(fā)的原生多模態(tài)大模型悟界Emu3.5,在去年10月30日就已經(jīng)正式發(fā)布并且開源。今年1月份,悟界·Emu正式登上《Nature》正刊,也是國內(nèi)多模態(tài)大模型方向的第一篇。
悟界·Emu3.5通過Next-Token Prediction這一實現(xiàn)方式,實現(xiàn)了文本、圖像、視頻的統(tǒng)一學習,實現(xiàn)了多模態(tài)理解任務和多模態(tài)生成任務的統(tǒng)一學習。
智源將Next-Token Prediction擴展到了神經(jīng)科學領域,研發(fā)出了悟界·Brainμ1.0,該模型能夠?qū)⒛X信號與其它模態(tài)互相轉(zhuǎn)化,可以將腦信號轉(zhuǎn)成文字、圖像、聲音,同時可以反過來轉(zhuǎn)換。
![]()
同時,智源發(fā)布了全球最大最全的AI-Ready神經(jīng)科學領域數(shù)據(jù)集,以及全球最大的AI-Ready神經(jīng)科學數(shù)據(jù)平臺BrainToken。
![]()
此外,智源還發(fā)布了悟界·OpenComplex 2.5,是可泛化物理支持的下一代AI驅(qū)動藥物發(fā)現(xiàn)模型。通過單一的流程,該模型覆蓋了制藥的四大關鍵步驟,包括口袋識別、反向篩選、結構預測、形成力預測。OpenComplex 2.5在多個benchmark上的核心指標,超過了傳統(tǒng)的物理方法和其他的AI模型。
![]()
二、提出世界模型四類技術路線,自研世界模型即將開源
世界模型方面,智源將當下世界模型的技術路線分為四類:
1、第一類是語言為中心的世界模型,包括VIMA等。
2、第二類是以像素為中心的視覺模型,如Sora。
3、第三類是以三維結構為中心的視覺模型,代表是李飛飛團隊成果。
4、第四類是以視覺表征為中心的世界模型,像是楊立昆團隊成果。
![]()
王仲遠分享稱,智源認為,以上四類技術路線距離真正的世界模型還存在一定差距。智源正在研發(fā)當中的世界基座模型——悟界·Physis v0.1。該模型具有AI底層典型四大核心能力:物理一致性、動作靈活性、長程可推演、通用泛化性。其通過為理前的空間建模,能夠真正實現(xiàn)全模態(tài)的輸入,以及下一步物理狀態(tài)的預測。
該模型目前還在訓練中,將在未來幾個月開源。
![]()
三、發(fā)布具身大腦,推出四款智能體
具身智能方面,王仲遠透露,智源最新研發(fā)的具身大腦悟界·RoboBrain Orca v0,是以下一個物理狀態(tài)預測為核心的具身大腦。它通過融合大量的多模態(tài)交互數(shù)據(jù),強化了世界模型在具身上的表征,提升下游少量樣本泛化能力,目前已與50余家企業(yè)進行了合作。
![]()
智能體方面,王仲遠在現(xiàn)場發(fā)布了四款智能體產(chǎn)品,包括:
1、面向心臟疾病的輔助診斷智能體:BAAI Cardiac Agent
該智能體是智源智源與安貞醫(yī)院共同研發(fā)的,能夠有效識別和處理心臟磁共振的多模態(tài)數(shù)據(jù),提升醫(yī)生的診斷效率。其心臟疾病診斷的精確度,能夠達到安貞醫(yī)院頂尖心血管醫(yī)生的診斷水平。
![]()
2、面向科學發(fā)現(xiàn)的自主研究智能體:AREX
該智能體能夠覆蓋科學研究的幾個關鍵環(huán)節(jié),包括信息調(diào)研、方案設計、實驗探究、報告撰寫。其背后所依賴的基座模型由智源自主研發(fā)。在權威的基準測試上,不僅能夠顯著超越同等參數(shù)的開源模型,更能夠比肩萬億參數(shù)級別的旗艦模型。
![]()
3、本屆智源大會專屬的聽會智能體:SoulAgent
該智能體可以幫助參會者實現(xiàn)智源大會一站式參會體驗,同時也能夠與先期入駐的智源大會的專家進行AI問答。
![]()
4、面向有害蛋白獲取的風險發(fā)現(xiàn)智能體
智源首次通過紅隊實驗的方法驗證:智能體能夠輔助篩查并獲取有害的蛋白,進而合成蛋白,將在近期公布相關的測試報告。
![]()
四、FlagOS更新至2.1版本,適配32款芯片
在基礎軟硬件生態(tài)方面,王仲遠介紹,智源研究院聯(lián)合開源社區(qū)打造的眾智FlagOS 現(xiàn)已更新至 2.1 版本。該系統(tǒng)適配18家芯片廠商的32款芯片,是目前全球適配芯片品類最多的計算系統(tǒng)。
FlagOS內(nèi)置算子超600個且數(shù)量仍在持續(xù)擴充,不僅為18家芯片廠商提供統(tǒng)一AI編譯器、為12家廠商提供通用技術支持,還同時完成國際標準與國家標準立項。
目前該系統(tǒng)可支撐90%以上主流開源模型部署,近期已完成DeepSeek、千問、MiniMax、MiniCPM、混元等多款熱門模型的無縫適配。
![]()
結語:AI技術發(fā)展,已經(jīng)迎來拐點
本屆智源大會釋放出多項行業(yè)動向。
首先,AI研究方向日趨多元,行業(yè)不再單純追逐模型參數(shù)規(guī)模,逐步向腦科學、藥物研發(fā)、心臟疾病診斷等實體應用領域深耕。其次,基礎軟硬件生態(tài)落地提速,眾智FlagOS已實現(xiàn)對32款芯片的適配,底層技術布局初見成效。
此外,兩位圖靈獎得主與國內(nèi)專家在分享中形成共識:隨著AI技術持續(xù)演進,僅依靠算力與數(shù)據(jù)堆砌已難實現(xiàn)長遠發(fā)展,技術路線規(guī)劃、安全體系搭建以及人機協(xié)同關系等核心議題,亟待全行業(yè)深入探索與正視。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.