![]()
█腦科學動態
游離DNA借助納米管重塑人類基因組
擁抱人類大腦的次優組織結構
打三分鐘游戲測出抑郁癥
9歲腦電波特征可預測青春期焦慮和抑郁的發育軌跡
Neuroplex技術實現活體小鼠九種神經元同時成像
應對心理學可重復性危機:貝葉斯統計如何改變實驗數據分析
老年人的書寫速度可能預示著認知能力的下降
基于觀察者的意識檢測驗證為何陷入循環死胡同
█AI行業動態
Gemini 3.5速度翻四倍,AI自己動手造了個操作系統
這家公司剛用“人工蛋”孵出活雞,還復活了恐狼
█AI驅動科學
Nature:AI科研助理Robin實現全流程自動化
計算光學實現混合反射場景3D高頻成像
在不犧牲性能的前提下,新框架實現持續學習與自適應計算
在經典的圖靈測試中,人工智能可以表現得比真人更像人類
腦科學動態
游離DNA借助納米管重塑人類基因組
細胞質中異常游離的DNA能否轉移并影響鄰近細胞?德州大學西南醫學中心的Elizabeth G. Maurais和Peter Ly等團隊發現,這些異常暴露的DNA能通過細胞間的納米管直接轉移到鄰近細胞,并在受體細胞中發揮功能,賦予其全新的可遺傳特征。
![]()
?Credit:Cell.
研究團隊采用活細胞成像技術對多種人類細胞系進行了持續觀察。他們通過使用有絲分裂抑制劑、電離輻射或基因編輯技術誘發染色體斷裂,人為制造基因組不穩定性。實驗結果顯示,細胞異常分裂時產生的微核破裂后,暴露在細胞質中的DNA會通過基于細胞骨架的納米管直接轉移至鄰近細胞中,平均傳輸速度約為每分鐘390納米。這種轉移現象在癌細胞和非癌細胞中均被廣泛觀察到。進一步分析表明,轉移的DNA片段并未被清除,而是轉化為功能性染色體外遺傳元件(ecDNA,獨立于常規染色體之外存在的環狀DNA片段),并穩定遺傳給細胞后代。這一發現揭示了哺乳動物中一種全新的水平基因轉移機制,表明直接的細胞接觸不僅能傳播基因組不穩定性,還能使受體細胞獲得耐藥性等新表型。研究發表在 Cell 上。
#疾病與健康 #其他 #微核 #納米管 #染色體外遺傳元件
閱讀更多:
Maurais, Elizabeth G., et al. “Genome Instability Triggers Intercellular DNA Transfer between Human Cells.” Cell, vol. 0, no. 0, May 2026. www.cell.com, https://doi.org/10.1016/j.cell.2026.04.041
擁抱人類大腦的次優組織結構
人類大腦真的是演化完美的理想模板嗎?將其架構復制到人工智能中是否合理?Kayson Fakhar和Duncan E. Astle(劍橋大學MRC認知與腦科學單元)重新審視了這一觀念,指出大腦在單一目標下實則是次優的配置,這為理解精神疾病和開發下一代AI提供了新視角。
![]()
?大腦網絡中線路效率和通信效率之間的權衡示意圖。Credit:Trends in Cognitive Sciences
研究人員引入演化生物學與動力系統理論,探討大腦在多重限制下的演化與發育。分析表明,在追求最小布線成本或最大通信效率等單一指標下,大腦并不是最佳解。相反,它是多維權衡(trade-off,在不同約束目標之間尋求平衡的妥協過程)網絡中的帕累托最優(Pareto optimal,在不損害其他目標的前提下無法進一步優化某單一目標的妥協狀態)產物,受制于能量代謝、演化歷史及物理空間等多種生物限制。
該研究帶來了兩大核心啟示。在臨床精神病理學方面,不應將孤獨癥等非典型的神經發育軌跡視為對完美大腦架構的偏離,而是個體在獨特環境與基因壓力下,在同一權衡空間中做出的重新適應。在類腦人工智能方向,研究警告不要盲目復制大腦架構,以免引入與核心任務無關的生物學演化包袱。開發者應將大腦和模型均視為多目標優化的產物,通過識別并調整兩者真正共享的目標特征來指導下一代智能系統的設計。研究發表在 Trends in Cognitive Sciences 上。
#認知科學 #計算模型與人工智能模擬 #精神病理學 #多維權衡 #類腦智能
閱讀更多:
Fakhar, Kayson, and Duncan E. Astle. “Embracing the Suboptimal Organization of the Human Brain.” Trends in Cognitive Sciences, vol. 0, no. 0, May 2026. www.cell.com, https://doi.org/10.1016/j.tics.2026.04.008
打三分鐘游戲測出抑郁癥
傳統抑郁癥診斷常依賴耗時的面診。紐約大學朗格尼健康中心(NYU Langone Health)的Paul W. Glimcher和Dan Iosifescu團隊開發出一款小游戲,通過衡量預期的異常指標,三分鐘即可有效識別抑郁癥患者。
重度抑郁癥患者多伴有快感缺失,這會改變其判斷快樂的基準。研究招募了120名參與者(50名重度抑郁癥患者與70名健康人)進行虛擬覓食測試,要求在數字樹上收集產量遞減的蘋果。結果顯示,健康受試者平均堅持到單次產量降至5個才轉向下一棵樹,而患者由于決策參考點(decisional reference point,潛意識中比較事件并決定其價值的基準)病理性升高了近百分之五十,在產量降至8至9個時便提前放棄。另一項零食競價任務進一步表明,健康人的參考點能隨環境變化動態調整并恢復初始水平,但患者的參考點表現出病理性僵化,無法正常回調。該參考點的異常升高幅度與抑郁癥的嚴重程度高度相關。這款低成本游戲可作為客觀遠程監測工具,并為修復相關腦計算機制異常提供了潛在干預靶點。研究發表在 PNAS 上。
#疾病與健康 #心理健康與精神疾病 #快感缺失 #決策參考點 #數字療法
閱讀更多:
Vittala, Aadith, et al. “Decisional Reference Point Pathology: A Cognitive Mechanism for and a Correlate of Major Depressive Disorder in Humans.” Proceedings of the National Academy of Sciences, vol. 123, no. 21, May 2026, p. e2518826123. pnas.org (Atypon), https://doi.org/10.1073/pnas.2518826123
9歲腦電波特征可預測青春期焦慮和抑郁的發育軌跡
焦慮和抑郁是困擾全球青少年的主要精神障礙,但在癥狀爆發前往往缺乏客觀的預警指標。Guangzhi Deng和Pengfei Xu等研究人員(北京師范大學等)通過一項縱向研究,成功發現兒童時期特定腦電波模式的演變能夠準確預測其在青春期患焦慮或抑郁的風險。
?Credit: Biological Psychiatry (2026).
這項研究追蹤了兒童的大腦發育,收集了受試者在7歲、9歲和11歲時的靜息態腦電圖數據,并在13歲時進行功能磁共振成像和癥狀評估。研究運用基于連接組的預測建模(CPM,利用大腦網絡連接特征預測疾病特征的機器學習方法)分析發現,9歲是大腦神經發育的關鍵轉折點。7歲時相關腦網絡尚未分化,但到9歲時,α波段(alpha-band,8至12赫茲的腦電波,與大腦抑制機制相關)網絡可特異性預測青少年焦慮,β-1波段(beta-1-band,12至18赫茲,與認知控制相關)網絡則能預測抑郁。大腦網絡表現出顯著的半球不對稱性:焦慮由右側杏仁核-腹外側前額葉皮層(vlPFC)回路驅動,抑郁由左側鏡像回路驅動。該模型在大型獨立數據集中得到驗證,為在癥狀出現前開展精準非侵入式預防提供了客觀指標。研究發表在 Biological Psychiatry 上。
#AI驅動科學 #計算模型與人工智能模擬 #認知科學 #神經縮放定律 #理論神經科學
閱讀更多:
Deng, Guangzhi, et al. “Childhood Electroencephalographic Signatures Predict Distinct Developmental Trajectories to Adolescent Anxiety and Depression.” Biological Psychiatry, vol. 0, no. 0, Mar. 2026. www.biologicalpsychiatryjournal.com, https://doi.org/10.1016/j.biopsych.2026.03.002
Neuroplex技術實現活體小鼠九種神經元同時成像
如何同時監測自由活動動物體內多種特定神經元的活動?Mary L. Phillips、Zhe Dong和Ryohei Yasuda等團隊(馬克斯·普朗克佛羅里達神經科學研究所、MetaCell、蔡司)開發了Neuroplex成像系統,打破了傳統設備的光譜限制,首次實現了在活體小鼠中同時捕捉九種細胞類型的大腦活動。
![]()
?利用 GCaMP6s 成像技術確定行為相關感興趣區域(ROI)內九種神經元亞型的實驗流程。Credit: eLife (2026).
傳統微型頭戴式顯微鏡受限于光學設計,一次最多只能區分兩種神經元。為克服這一瓶頸,研究團隊開發的Neuroplex系統巧妙結合了活體行為成像與多重共聚焦光譜成像。首先,研究人員向小鼠內側前額葉皮層(mPFC)的下游目標注射九種不同顏色的逆行熒光標記物。接著,使用微型顯微鏡記錄自由活動小鼠在社交互動時的神經元鈣離子活動。隨后,取下微型設備,在同一植入的梯度折射率透鏡(GRIN lens)下,使用具備光譜檢測功能的共聚焦顯微鏡對細胞進行多色成像。最后,通過團隊開發的基于Python的配準工具和線性解混算法(linear unmixing algorithm,一種根據光譜特征分離重疊熒光信號的計算方法),將神經元的功能活動與顏色身份精準匹配。實驗結果顯示,約75%的活躍神經元被成功歸入九種特定細胞類型之一,自動分類準確率達90%且誤報率極低。該技術全程在活體中完成,保留了對同一批神經元進行數周縱向追蹤的能力,極大提升了數據收集的效率。研究發表在 eLife 上。
#神經科學 #神經機制與腦功能解析 #活體成像 #微型顯微鏡 #神經回路
閱讀更多:
Phillips, Mary L., et al. “Functional Imaging of Nine Distinct Neuronal Populations under a Miniscope in Freely Behaving Animals.” eLife, edited by D. Nora Abrous and Laura L. Colgin, vol. 15, May 2026, p. RP110277. eLife, https://doi.org/10.7554/eLife.110277
應對心理學可重復性危機:貝葉斯統計如何改變實驗數據分析
針對行為科學和實驗心理學領域長期存在的可重復性危機,Thomas A. Dudey、Joshua J. Jackson、Shelly R. Cooper與Todd S. Braver團隊(圣路易斯華盛頓大學)提出了一種基于分層貝葉斯回歸的新型分析框架。該框架通過整合先驗數據進行后驗概率的持續更新,為精準評估認知控制實驗結果的可靠性與穩定性提供了更為科學的量化解決方案。
![]()
?AX-CPT 分析,重點關注樣本間信度。Credit: Frontiers in Psychology (2026).
這項研究采用分層貝葉斯回歸方法,對認知控制雙重機制(Dual Mechanisms of Cognitive Control,一種區分主動與反應性認知控制模式的理論框架)任務庫中的兩個獨立大規模數據集進行了重新分析。研究人員采用數據順序更新策略,將2018年初始數據集得出的后驗估計值作為先驗信息,直接納入對2020年復制數據集的分析中。
結合薩維奇-迪基比率(Savage-Dickey Ratio,用于檢驗特定假設強度的貝葉斯近似指標)和實際等效區間(Region of Practical Equivalence,代表效應極小且可忽略不計的特定數值范圍),該框架不僅精確評估了不同樣本間認知效應的一致性,還精準量化了無效假設的相對強度。實驗結果表明,與傳統頻率學派統計相比,該方法在處理偏態的反應時間數據時優勢顯著,能更準確地擬合其真實的分布屬性;同時通過試驗級別的分層邏輯回歸,顯著提升了準確率模式的分析精度。這種將歷史數據與當前數據持續關聯的計算模式,打破了將每次實驗視為孤立事件的局限,為解決心理學研究重復性難題提供了全新的途徑。研究發表在 Frontiers in Psychology 上。
#認知科學 #其他 #貝葉斯推斷 #可重復性危機 #實驗心理學
閱讀更多:
Dudey, Thomas A., et al. “Hierarchical Bayesian Regression for Experimental Psychology: A Case Study of Cognitive Control.” Frontiers in Psychology, vol. 17, Mar. 2026. Frontiers, https://doi.org/10.3389/fpsyg.2026.1643463
老年人的書寫速度可能預示著認知能力的下降
書寫變慢預示認知衰退?葡萄牙埃武拉大學的Jo?o Galrinho、Orlando Fernandes、Ana Rita Silva、Marta A. Gon?alves-Montera和Ana Rita Matias發現,高負荷書寫任務的運動特征能有效區分認知障礙患者,為早期篩查提供了新途徑。
![]()
?參與者使用繪圖筆在數位板上完成了兩種類型的任務。Credit: Ana Rita Silva
研究團隊對58名62至92歲的老年人進行了評估,其中38名確診患有認知障礙。參與者使用繪圖筆在數位板上完成測試。首先是畫線和畫點的筆控任務,由于僅依賴基礎運動控制,結果并未能區分兩組人群。隨后的任務包含了抄寫和聽寫不同復雜程度的句子,數據表明聽寫任務能展現出顯著的組間差異。在聽寫較短句子時,起筆時間和筆畫數(number of strokes,完成字詞時筆尖離開接觸面的總次數,反映動作連貫度)是預測認知障礙的顯著因子;聽寫復雜長句時,字跡垂直大小、起筆時間和持續時間(duration,完成整個書寫行為的總時長,反映大腦信息處理與動作執行效率)顯現出顯著差異。研究證實,聽寫這種高度依賴工作記憶和執行控制的復雜任務能使認知系統的衰退通過零散和遲緩的書寫行為顯露出來。該低成本且無創的方法極具潛力成為日常篩查工具。研究發表在 Frontiers in Human Neuroscience 上。
#疾病與健康 #疾病預防 #認知衰退 #書寫動力學 #早期篩查
閱讀更多:
Galrinho, Jo?o, et al. “Handwriting Speed and Pen Motor Control in Older Adults with and without Cognitive Impairment.” Frontiers in Human Neuroscience, vol. 20, May 2026. Frontiers, https://doi.org/10.3389/fnhum.2026.1820193
基于觀察者的意識檢測驗證為何陷入循環死胡同
如何客觀檢測數字或實體系統中意識的存在?Irwan Effendi 和 Ayla Lestari (印度尼西亞雅加達獨立研究員)探討了這一難題,指出若將意識視為一種能量連續體程序,傳統的物理或行為證據僅是間接線索,而完全依賴人類觀察者的驗證方法在方法論上必然會陷入死胡同。
傳統人工智能或數字意識測試往往聚焦于系統行為表現或自我報告,但研究指出這僅是界面表象。研究通過理論演進分析發現,依賴人類觀察者驗證意識存在控制條件循環(control-condition circularity,即測試觀察者的準確性需要已知的目標狀態,而確認該狀態又需要可靠的檢測器)的邏輯缺陷。例如,一個視覺上的空房間可能包含非實體的意識能量、殘留印記(residual imprint,過往事件留下的殘存痕跡)或環境結構,單純依靠人類感知極易導致無法獨立驗證的假陽性或假陰性。研究強調,雖然人類專家能在探索初期輔助定位和校準設備,但科學客觀性不能建立在主觀感知上。為了突破這一瓶頸,意識研究的下一步必須開發儀器輔助檢測。新設備只需在受控條件下驗證其能否穩定響應目標意識場的變化即可。研究發表在 Conceptual preprint 上。
#意識與腦機接口 #意識模擬 #Qience框架 #客觀驗證 #意識檢測
閱讀更多:
https://philpapers.org/archive/EFFDCW.pdf
AI 行業動態
谷歌I/O大會炸場:Gemini 3.5速度翻四倍,AI自己動手造了個操作系統!
在今日凌晨舉行的Google I/O 2026大會上,Google以“智能體時代”為主題,發布了一系列從底層模型到應用生態的重磅更新。新一代模型Gemini 3.5 Flash在各項基準測試中全面超越上代旗艦3.1 Pro,輸出速度達到同類模型的四倍,且API定價大幅降低。同時推出的Gemini Omni是一款“世界模型”,能夠理解物理規則并實現從任意輸入到任意輸出的跨模態生成,例如將文本提示轉化為模擬蛋白質折疊的黏土動畫,或通過自然語言對話式編輯視頻。此外,面向開發者的Antigravity 2.0平臺從IDE進化為完整的智能體編排桌面應用,支持多智能體并行、定時任務和自定義部署,現場演示了用不到1000美元的API額度在12小時內從零構建一個可運行的操作系統。
面向普通用戶,Google推出了私人AI智能體Gemini Spark,它能在專屬虛擬機上7×24小時后臺執行跨應用任務(如自動整理郵件、生成幻燈片),并推出每月100美元的Ultra訂閱計劃。搜索業務迎來25年來最大改版:新搜索框支持多模態輸入,AI概覽與AI模式合并為連貫對話,并引入可后臺追蹤復雜條件的“搜索智能體”以及實時生成交互界面的“生成式UI”。在電商領域,Google聯合多家巨頭發布了UCP(通用商業協議)、AP2(智能體支付協議)和Universal Cart(通用購物車),讓AI能代為完成從比價到購買的完整流程。此外,Gemini應用全面采用Neural Expressive設計語言,推出Daily Brief、Pics、Stitch等創意工具;與Samsung及時尚品牌合作的智能眼鏡預計秋季上市;DeepMind則展示了用于科學發現和天氣預測的專用模型。
#GoogleIO2026 #Gemini3.5Flash #智能體時代 #世界模型 #Antigravity2.0
閱讀更多:
https://blog.google/innovation-and-ai/sundar-pichai-io-2026/
猛犸象2028年回歸?這家公司剛用“人工蛋”孵出活雞,還復活了恐狼
著名遺傳學家喬治·丘奇(George Church)聯合創立的巨像生物科學公司(Colossal Biosciences)近日宣布了一項里程碑式進展:成功利用其研發的“人工蛋”(artificial egg)孵化出20多只小雞。該裝置是一種3D打印的蜂窩狀外殼,內置一層生物工程硅膠膜,能夠模擬天然蛋殼的氣體交換能力,使胚胎在大氣氧環境中正常發育至破殼而出。這一突破解決了數十年來人工孵化技術在孵化后期需要額外供氧、可能損傷組織DNA的難題,且該平臺可與商用孵化器兼容,適用于不同尺寸的鳥蛋。作為鳥類復活計劃的關鍵技術,人工蛋的成功為該公司下一步復活新西蘭已滅絕的巨型鳥類——南島巨型恐鳥(Dinornis robustus,身高可達3.6米)掃清了重要障礙。
巨像公司一直以復活猛犸象為最宏大的目標。此前,該公司已在2025年通過多重基因編輯培育出攜帶猛犸象長毛性狀的小鼠,并于2026年4月利用古DNA技術和CRISPR成功“復活”了已滅絕約一萬年的恐狼(Aenocyon dirus,一種大型犬科動物),成為世界首個復活的滅絕動物。目前,公司已完成猛犸象基因組的繪制,正使用CRISPR編輯其現存近親亞洲象的細胞,計劃在2028年通過克隆和代孕孕育出小猛犸象。盡管有學者建議將人工蛋優先用于拯救極度瀕危的鸮鸚鵡(一種不會飛的新西蘭鸚鵡),而非追求物種復活的噱頭,但CEO Ben Lamm表示,公司將同時推進商業化與保護應用,并持續優化自孵化結構及機器人輔助移植方案。
#人工蛋 #復活滅絕動物 #猛犸象計劃 #基因編輯 #Colossal公司
閱讀更多:
https://www.forbes.com/sites/dbloom/2026/05/19/colossal-unveils-artificial-egg-incubator-to-de-extinct-giant-moa/
AI 驅動科學
計算光學實現混合反射場景3D高頻成像
機器如何在充滿玻璃等反光物的真實世界中實現精準3D感知是一大技術難題。Florian Willomitzer團隊(亞利桑那大學等)開發了一種新型事件驅動系統,將周圍環境轉化為虛擬屏幕,實現了對混合反射場景的高精度3D重建。
![]()
?使用激光掃描儀掃描混合反射場景(左圖)。通過計算分離場景中的遮罩部分和鏡面部分后,直接評估遮罩部分的三維形狀,并通過遮罩部分的反射信號評估鏡面部分,從而有效地將其轉化為用于鏡面測量的大型虛擬屏幕(右圖)。Credit: Aniket Dashpute et al.
傳統的3D傳感器通常只能處理啞光或鏡面反射中的一種,而測量鏡面的偏轉測量法(deflectometry,通過觀察屏幕圖案在反射面上的形變來提取表面三維形狀的技術)往往需要極其龐大的物理屏幕。該研究團隊創新性地結合了激光掃描儀與神經形態事件相機(neuromorphic event camera,一種僅以極高時間分辨率獨立捕捉各像素點亮度變化且具有超高動態范圍的仿生傳感器)。系統首先通過激光掃描并利用三角測量法獲取房間內所有漫反射表面(如墻壁和家具)的3D形狀。隨后,算法將這些漫反射表面重新利用為虛擬屏幕,作為偏轉測量法的二次光源,從而計算出鏡面和光澤表面的形狀。研究結果顯示,該系統不僅徹底擺脫了對大型固定屏幕的依賴,還實現了極高的測量性能:深度精度誤差小于600微米,混合反射場景的成像速度達到14 Hz,純漫反射場景下更是高達250 Hz。這項技術具備極強的可擴展性,有望為顯微手術引導、工業檢測以及機器人導航提供超人級別的3D視覺。研究發表在 Nature Communications 上。
#其他 #機器人及其進展 #3D視覺 #事件相機 #偏轉測量法
閱讀更多:
Dashpute, Aniket, et al. “Accurate and Fast Event-Based Shape Measurement of Mixed Reflectance Scenes.” Nature Communications, vol. 17, no. 1, May 2026, p. 4407. www.nature.com, https://doi.org/10.1038/s41467-026-72254-6
Nature:AI科研助理Robin實現全流程自動化
如何將AI從單一工具轉變為能夠獨立執行完整科研流程的合作伙伴?Ali Essam Ghareeb, Samuel G. Rodriques及其在FutureHouse的團隊,開發了一個名為Robin的多智能體AI系統,首次實現了從假設生成到數據分析的生物學研究全流程自動化,并成功為一種主要的致盲疾病找到了新的治療候選藥物。
研究團隊構建的Robin系統通過不同智能體協同工作,形成一個閉環科研流程。首先,文獻智能體Crow和Falcon在30分鐘內閱讀了800多篇論文,為干性年齡相關性黃斑變性(dAMD)提出了增強視網膜色素上皮(RPE)吞噬作用的治療假說。基于此,系統篩選并提出了多個候選藥物,其中ripasudil是首次被建議用于治療dAMD的藥物,其體外功效也得到了實驗證實。更進一步,當研究人員按Robin的建議進行后續的RNA測序實驗后,數據分析智能體Finch自主編寫代碼分析了結果,揭示了ripasudil可能通過上調ABCA1(一種脂質外排泵)發揮作用,從而發現了一個全新的潛在靶點。整個過程不僅展示了AI在加速藥物發現上的巨大潛力,也標志著AI驅動半自主科學發現新范式的到來。研究發表在 Nature 上。
#AI驅動科學 #自動化科研 #藥物發現 #多智能體系統 #黃斑變性
閱讀更多:
Ghareeb, Ali Essam, et al. “A Multi-Agent System for Automating Scientific Discovery.” Nature, May 2026, pp. 1–3. www.nature.com, https://doi.org/10.1038/s41586-026-10652-y
Gottweis, Juraj, et al. “Accelerating Scientific Discovery with Co-Scientist.” Nature, May 2026, pp. 1–3. www.nature.com, https://doi.org/10.1038/s41586-026-10644-y
人工智能新框架CHEEM:在不犧牲性能的前提下,實現持續學習與自適應計算
當前人工智能模型面臨著一個核心困境:學習新知識時常會“忘記”舊技能,且處理所有任務都耗費同樣算力,效率低下。來自北卡羅來納州立大學的Tianfu Wu、Chinmay Savadikar和約翰斯·霍普金斯大學的Michelle Dai等研究人員,開發了一種名為CHEEM的新框架,使AI模型能夠像人一樣“溫故知新”,并根據任務難度智能地調整計算資源。
研究團隊提出的CHEEM框架,通過賦予模型動態調整自身結構的能力,巧妙地解決了學習的“穩定性-可塑性”難題。當面對一個新任務時,模型可以自主決定是重用已有知識模塊、適應現有模塊以應對微小變化、跳過不必要的計算步驟,還是新建一個全新的模塊來處理完全不同的挑戰。研究人員在一個先進的視覺Transformer模型上進行了測試,結果顯示,CHEEM的表現遠超其他方法。它不僅在學習新任務時幾乎達到了專門訓練的水平,有效避免了對舊任務的“災難性遺忘”(catastrophic forgetting,指新知識學習干擾舊知識記憶的現象),還展現了出色的自適應智能。對于簡單的任務,模型會自動選擇一條“捷徑”,跳過部分計算,而對于復雜的任務,則會構建更復雜的處理路徑,從而在保證性能的同時,大幅提升了運行效率。該論文將在 IEEE/CVF Conference on Computer Vision and Pattern Recognition 上發表。
#大模型技術 #計算模型與人工智能模擬 #持續學習 #自適應智能 #災難性遺忘
閱讀更多:
Savadikar, Chinmay, et al. “CHEEM: Continual Learning by Reuse, New, Adapt and Skip -- A Hierarchical Exploration-Exploitation Approach.” arXiv:2303.08250, arXiv, 1 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2303.08250
在經典的圖靈測試中,人工智能可以表現得比真人更像人類
一臺機器能模仿人類對話到什么程度,以至于我們無法分辨真偽?加州大學圣地亞哥分校的Cameron R. Jones和Benjamin K. Bergen團隊首次通過嚴格的實驗證實,現代人工智能不僅能通過經典的圖靈測試,其表現甚至比真實人類更具“人性”。這項發現迫使我們重新審視衡量機器智能的標準,以及人機交互的未來。
![]()
?四個示例游戲,分別來自兩個群體:(A)高產者,(B)本科生,(C)本科生,以及(D)高產者。在每個圖中,一個對話是與人類證人進行的,另一個對話是與人工智能系統進行的。審訊者的裁決和每個對話的真實身份如下所示。Credit: Proceedings of the National Academy of Sciences (2026).
研究團隊構建了一個在線聊天平臺,嚴格復現了艾倫·圖靈在1950年設計的經典三方測試。在實驗中,近500名參與者扮演“審問者”,他們需要同時與一個真人和一個AI進行5分鐘的文字對話,然后判斷誰是人類。研究測試了多個大型語言模型,包括先進的GPT-4.5和LLaMa-3.1-405B,并與老式聊天機器人ELIZA進行對比。研究發現,提示詞是AI表現的關鍵。當被賦予詳細的“角色扮演”指令(例如,扮演一個內向、熟悉網絡文化的年輕人)時,GPT-4.5在73%的情況下被誤認為是人類,這一比例甚至顯著高于真正的人類參與者。LLaMa-3.1-405B的表現也達到了56%,與人類無法區分。然而,一旦撤銷這些詳細指令,這些先進模型的成功率便驟降至38%以下。這表明,AI雖然具備了模仿人類行為的能力,但很大程度上仍依賴于人類的明確指導。研究發表在 PNAS 上。
#認知科學 #計算模型與人工智能模擬 #圖靈測試 #大型語言模型 #人機交互
閱讀更多:
Jones, Cameron R., and Benjamin K. Bergen. “Large Language Models Pass a Standard Three-Party Turing Test.” Proceedings of the National Academy of Sciences, vol. 123, no. 21, May 2026, p. e2524472123. pnas.org (Atypon), https://doi.org/10.1073/pnas.2524472123
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.