<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      告別科研“七步馬拉松”,一個AI智能體正在改寫知識生產方式

      0
      分享至



      如果把科研流程整體交給智能體執行,會發生什么?

      科研這件事,長期被浪漫化了。

      它并不是一個統一的動作,而是一條被拆分得很細的流水線。檢索、篩選、閱讀、整理、假設、實驗、驗證,再回到寫作與發表——這七個環節幾乎構成了所有學術工作的基本路徑。

      問題在于,這條路徑的每一個環節,都在消耗時間,但并不都在創造價值。

      文獻檢索往往意味著在成千上萬篇論文中篩選出幾十篇真正相關的內容。閱讀階段需要逐篇理解方法與結論,再在腦中建立一個尚不穩定的認知結構。真正到問題定義時,研究者才開始進入“創造”的部分,而這往往已經消耗掉了大量時間。

      這些環節,本質上都屬于“確定性勞動”,它們可以被拆解、被描述、被重復執行,但依然依賴人工完成。這就形成了一種典型的錯配:最寶貴的認知資源,被大量消耗在最容易被替代的部分。

      過去十年,AI確實進入了科研,但更多停留在邊緣。它幫人更快地找論文、更順暢地翻譯文本、甚至能寫出一篇結構完整的綜述,但這些能力并沒有改變科研的基本形態。科研仍然是一場“七步馬拉松”,只是跑得稍微快了一點。

      一個更激進的命題擺到了臺面上:如果把科研流程整體交給智能體執行,會發生什么?

      近期剛剛升級的AI學術智能體切問學術(即WisPaper中文版)給出了一種新可能。把確定性的勞動交給算力,把不確定的靈感還給人。這句話的背后,是一整套關于科研生產方式的重新分配。



      AI不生產論文,但加速進程

      傳統科研過程中,七步走的科研馬拉松,需要人在不同環節之間反復切換與銜接。

      切問學術的出現,并不意味著它可以直接生產論文。它更多是嵌入到科研的推進過程中,成為一種貫穿式能力。給定一個研究任務,系統可以從文獻檢索出發,完成閱讀、分析與信息結構化,在此基礎上識別潛在問題,進一步進入實驗設計與執行,最終輸出結果與報告。

      AI在科研中的角色,也因此發生變化。過去的AI更像“助手”,它在旁邊提供建議,或者幫你完成某一部分工作。這些工作多是局部性的,比如翻譯一篇論文,總結一段內容,或者補全一段代碼,研究者需要不斷接管流程,在不同任務之間來回切換,維持整體推進。

      無法避免的機器幻覺,又讓這部分工作需要被復審,以此來規避可能出現的學術欺詐、造假風險。切問學術作為AI智能體的定位,更接近“執行者”,它可以在沒有持續人工介入的情況下,自主完成一部分內容。這意味著,科研流程第一次出現“被托管”的可能。

      用一個更直觀的類比,它有點像自動駕駛。在自動駕駛體系中,人類負責設定目標,系統負責路徑與執行。

      同樣的邏輯正在引入科研之后,類似的分工正在出現。研究者定義問題,切問學術作為智能體負責推進過程。

      科研流程的變化,從這里開始顯現。

      首先是流程的歸屬被重新劃分。原本需要人逐步完成的任務,被整合為一段可以被系統整體接管的過程。檢索、閱讀、整理這些原本高度依賴人工的環節,不再需要逐一介入,而是在同一套邏輯中被連續處理。



      其次,科研的工作方式從串行過程轉向并行結構。在此類AI智能體介入后,科研不再只能沿著單一路徑推進。多個假設可以被同時展開,多個方向可以并行驗證。一個研究者的工作方式,從完成一個問題,轉向管理一組問題。

      當流程本身開始被重新組織,科研的節奏也隨之改變。

      100倍速引擎,科研第一次出現“代差”

      從產品能力上來說,切問學術做的第一件事,是把傳統科研路徑的鏈條“解耦”。在傳統路徑里,每一個環節之間都存在等待與切換成本。而切問學術帶來的,是指數級別的效率提升。

      這種變化是具體的。據其公開資料顯示,對比傳統人工,切問學術的AI4S模式,在文獻檢索方面預估提效10至100倍,原本需要數周完成的文獻篩選,被壓縮到分鐘級;論文閱讀20倍提升,需要數月完成的閱讀與整理,被壓縮到小時級的結構化提取;問題識別可以在全域數據中被系統性掃描與定位,50倍速鎖定。這樣的效率飛升,幾乎可以說重塑科研生命周期。

      與此同時,切問學術的提效,建立在有效且可靠的基礎上。就其公布數據來看,切問學術的文獻搜索準確率達到93.78%,而主流模型大致停留在70%左右;文檔版式解析、公式解析與表格解析準確率均在90%以上,整體高于行業水平。



      這些能力并不直接產生結論,卻決定了信息以什么形態進入后續處理。變量關系、實驗結構、數據分布被提前拆解,閱讀從逐篇處理轉為結構化接收。

      尤其是切問學術在測試中的綜述一致性達到了22.26%,并且引用真實性接近99.8%。前者決定了不同來源的信息是否能夠被納入同一套邏輯框架,后者則真正在杜絕生成式模型機器幻覺方面邁出了一大步。

      也正是在這樣的基礎之上,其嵌入科研流程的價值,才有成立的空間。

      本次升級中的一大亮點,在于實驗等環節的深入。上傳一篇論文,系統自動完成閱讀與理解,拆解核心任務與算法邏輯;在此基礎上,解析實驗方法,生成可執行的實驗方案;隨后自動搭建計算環境,包括算力配置與依賴項;生成代碼并執行實驗流程,最終輸出結果與完整實驗報告。

      整個過程,不需要人工逐步介入。切問學術可以基于已有文獻或系統識別出的研究空白,自動生成實驗路徑,并且自主匹配或尋找數據,完成環境搭建,執行實驗并輸出結果。

      傳統科研流程中的“認知”與“執行”是分離的。理解可以被加速,但驗證仍然依賴人。而現在原本需要人反復切換、反復試錯的一整段,被整體提速。科研流程,從“人驅動”變成“智能驅動”。

      在這個意義上,它或許代表著科研效率的代際更替。

      而這一切,并不是通用大模型就可以實現的。比如說學習能力,傳統大模型或許擅長考試,但是對于從未見過的新知識,存在學習障礙。在CL-bench測試中,大模型們需要理解一套完全陌生的規則,并在上下文中立即應用。大多數模型在這一環節失效,平均成功率只有17.2%。



      科研場景恰恰依賴這種能力,每一個問題,都是新的。當模型可以在上下文中快速建立規則理解,它才具備進入科研流程的基礎。

      也正因此,切問學術針對如何在真實環境中推進任務有針對性優化。其進行的AgentGym-RL的訓練方式,是更接近真實科研的環境,模型需要在網頁操作、實驗流程等任務中不斷調整路徑。執行不能依賴預設答案,而是在反饋中不斷修正。

      就相關論文文獻顯示,一個僅有70億參數的小模型(Llama-3.1-8B),經過AgentGym-RL訓練后,在多個場景中達到了與GPT-4o、Claude 3.5-Sonnet相當甚至更好的表現。

      同時,在訓練過程中其針對推理、代碼等關鍵能力相關的Token賦予更高權重,讓能力提升與訓練指標對齊。

      但即便具備在真實環境中推進任務的能力,這件事依然沒有那么簡單。模型要真正進入科研流程,還要解決一個更隱蔽的問題,訓練本身的穩定性。

      RLHF幾乎是所有大模型對齊能力的核心路徑。但這套方法有一個共識性的難點:PPO訓練極不穩定。這也是為什么,很多模型在短任務中表現良好,一旦進入復雜流程,就開始出現不可控偏移。

      切問學術通過PPO-max通過更細粒度的約束與獎勵機制,讓訓練過程保持穩定,不再依賴運氣。

      穩定之后,是執行。調用工具、編寫代碼、處理環境依賴,這些環節本身就充滿不確定性。傳統模型在這一部分往往依賴模板,或者停留在“生成代碼”的層面,一旦進入真實執行環境,就會出現偏差。

      科研環境里,信息本身并不總是一致的。不同論文之間可能存在結論沖突,數據來源也可能帶來偏差。模型如果只是簡單整合,很容易在多源信息中失真。

      而切問學術在面對“已有記憶”與“當前輸入”不一致時,會在內部形成兩條處理路徑,最終根據不同信號強度做出選擇。這讓模型在復雜文獻環境中具備基本的判斷能力,而不是被動接受信息。

      當這些能力聚合,變化就不再是局部的提升。它更代表著,科研的生產方式,正在發生一次真正的范式轉變。

      當科研回歸到“人”,加速突破的臨界點

      在這場變化里,被改變的并不只是效率。

      科研的工作方式,開始從親自完成每一步,轉向在關鍵節點做判斷。當執行被系統接管,研究者不再需要反復進入那些確定性的流程,而是逐漸退出具體操作,轉而站在更上層的位置去理解問題、選擇路徑、審視結果。

      這種變化看起來微妙,也在悄悄重寫科研的角色分工。那些最聰明的大腦,不再需要在流程中奔跑。從更接近執行者的角色,轉向架構者或者說領導者。

      同時,另一道隱形門檻也在消失。在很多領域,idea和結果之間隔著代碼、算力與實驗環境。這部分需求一旦被切問學術一類的智能體解決,科研的進入門檻會被重新定義。

      結果是,科研競爭開始前移。從誰能做出來,變成誰能更早看到問題,回歸到了定義問題的“人”。一些原本受限于技術條件的研究者,也可以更直接參與到問題本身。



      科研的本質,是知識生產。當知識生產的周期被壓縮,影響的是整個技術體系的節奏。除了時間成本下降之外,知識庫更新頻率也在同步加速。比如新材料、靶向藥、清潔能源這些受到驗證成本限制的領域,驗證一旦被壓縮,路徑篩選會明顯加快,錯誤方向更早被淘汰,可行路徑更快浮現。

      這意味著,研究會在更高密度的試探中不斷逼近答案。原本需要多年才能積累的試錯過程,被壓縮到更短周期內反復發生。

      技術突破的出現方式,也隨之發生變化,從依賴個體經驗的偶然發現,轉向在高頻驗證中逐步收斂。

      當這種節奏持續疊加,一個更接近臨界點的狀態開始出現。科研開始進入一種新的分工結構:AI負責推進已知路徑,把確定性的部分持續壓縮;而人則停留在未知區域,去判斷哪些問題值得被繼續追問。

      封面來源|視覺中國

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      郭富城攜妻女寧波吃飯,兩女兒活潑可愛顏值超高,非常黏爸爸

      郭富城攜妻女寧波吃飯,兩女兒活潑可愛顏值超高,非常黏爸爸

      手工制作阿殲
      2026-06-01 21:55:25
      反常識:癌癥擴散最兇猛的不是晚年,是中年

      反常識:癌癥擴散最兇猛的不是晚年,是中年

      科學邊界哦
      2026-05-31 23:36:10
      店員諷刺顧客“窮逛”后續:臉丟光了,工作沒了,商場慘遭牽連

      店員諷刺顧客“窮逛”后續:臉丟光了,工作沒了,商場慘遭牽連

      大魚簡科
      2026-06-01 19:30:25
      萬萬沒想到,西貝翻車的路,愛奇藝又走了一遍,網友群嘲:沒底線

      萬萬沒想到,西貝翻車的路,愛奇藝又走了一遍,網友群嘲:沒底線

      離離言幾許
      2026-05-31 21:21:29
      最可怕的不是早期肺癌沒癥狀,是晚期肺癌也沒有癥狀,如何發現?

      最可怕的不是早期肺癌沒癥狀,是晚期肺癌也沒有癥狀,如何發現?

      呼吸科大夫胡洋
      2026-06-02 06:23:36
      美股三大指數集體低開 英偉達進軍PC芯片市場引爆產業鏈

      美股三大指數集體低開 英偉達進軍PC芯片市場引爆產業鏈

      財聯社
      2026-06-01 21:32:06
      廣廈VS上海G4時間確定,盧偉采訪被楊鳴調侃,孫銘徽不再想當綠葉

      廣廈VS上海G4時間確定,盧偉采訪被楊鳴調侃,孫銘徽不再想當綠葉

      體育大學僧
      2026-06-01 12:37:29
      利物浦1.3億英鎊打水漂,自由離隊潮是瘋了嗎?

      利物浦1.3億英鎊打水漂,自由離隊潮是瘋了嗎?

      日常碎碎念啊
      2026-06-02 01:24:52
      1810萬鎊超值!曼聯門將拉門斯力壓群雄,榮膺英超賽季最佳引援

      1810萬鎊超值!曼聯門將拉門斯力壓群雄,榮膺英超賽季最佳引援

      星耀國際足壇
      2026-06-01 23:47:59
      順德70后女老板,賣爆200萬臺咖啡機搶瑞幸飯碗,一年狂賺5個億

      順德70后女老板,賣爆200萬臺咖啡機搶瑞幸飯碗,一年狂賺5個億

      商業人物志
      2026-05-31 08:50:08
      單位里有一個很奇怪的現象:你跟一個領導 3 年以上,不管你態度多好,多忠誠,一旦他狀態不好,你就很容易成為他的“眼中釘”

      單位里有一個很奇怪的現象:你跟一個領導 3 年以上,不管你態度多好,多忠誠,一旦他狀態不好,你就很容易成為他的“眼中釘”

      互聯網思維
      2026-05-29 23:35:13
      “砰!”一聲,10歲女孩左眼差點永久失明!很多家庭都有這種“隱形殺手”

      “砰!”一聲,10歲女孩左眼差點永久失明!很多家庭都有這種“隱形殺手”

      齊魯壹點
      2026-06-02 06:16:10
      白撿24TB硬盤!員工拆開公司淘汰設備后直接樂壞了

      白撿24TB硬盤!員工拆開公司淘汰設備后直接樂壞了

      游民星空
      2026-05-31 12:27:20
      網傳985女生相親,男生直接落荒而逃網友說:該校出品必屬精品!

      網傳985女生相親,男生直接落荒而逃網友說:該校出品必屬精品!

      燈錦年
      2026-06-01 18:17:11
      明明有著大好前途,卻為了名利甘作情婦,最終事情敗露前途盡毀

      明明有著大好前途,卻為了名利甘作情婦,最終事情敗露前途盡毀

      混沌錄
      2026-06-01 22:52:06
      杉杉內斗兩敗俱傷后,家被安徽國資用70億“抄”了

      杉杉內斗兩敗俱傷后,家被安徽國資用70億“抄”了

      毒sir財經
      2026-06-01 23:15:56
      重磅!中國科學院院士周成虎官宣被查

      重磅!中國科學院院士周成虎官宣被查

      李昕言溫度空間
      2026-06-01 20:33:54
      英媒:伊朗破壞20處美軍設施

      英媒:伊朗破壞20處美軍設施

      參考消息
      2026-06-01 21:26:25
      《星際2》發布史詩級更新,玩家驚呼:這是星際3吧!

      《星際2》發布史詩級更新,玩家驚呼:這是星際3吧!

      熱搜摘要官
      2026-06-02 00:00:32
      國足今日出戰!時隔7年,沖擊小組前2,盼贏球劍指4強,憧憬冠軍

      國足今日出戰!時隔7年,沖擊小組前2,盼贏球劍指4強,憧憬冠軍

      小徐講八卦
      2026-06-02 05:27:08
      2026-06-02 07:00:49
      36氪 incentive-icons
      36氪
      讓一部分人先看到未來
      151544文章數 2848783關注度
      往期回顧 全部

      科技要聞

      黃仁勛演講實錄|40年來PC首次重設計!

      頭條要聞

      伊朗計劃徹底封鎖霍爾木茲海峽 特朗普回應

      頭條要聞

      伊朗計劃徹底封鎖霍爾木茲海峽 特朗普回應

      體育要聞

      杰威:如果我沒受傷,我們能擊敗馬刺

      娛樂要聞

      奚夢瑤婚禮現場圖!一雙兒女當花童

      財經要聞

      宇樹過會,杭州贏麻了

      汽車要聞

      奇瑞集團5月銷量24.8萬輛 同比增長20.5% 出口18.2萬輛再創新高

      態度原創

      教育
      家居
      時尚
      游戲
      健康

      教育要聞

      教育部:高考命題突出反押題、反套路導向,靠AI或“專家”押中題目的可能性極小

      家居要聞

      自信舒展 高背座椅

      夏天褲子不用多買,闊腿褲一整個夏天都能穿,日常出行好打理

      LPL最圈粉戰隊誕生!曾是LPL豪門落寞多年,如今上萬人打出滿分

      干細胞臨床研究向患者收費?別踩坑

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 伊人精品一本久久综合| 亚洲色欲网| 玩弄丰满少妇xxxxx性多毛| 亚洲国产精品久久久久秋霞| 在线国产精品中文字幕| 国产sm重味一区二区三区| 无遮挡成年黄漫画网站| 丝袜人妻| 国产99在线 | 欧美| 国产大片喷水在线在线视频| 亚洲国产AV色| 老司机午夜福利试看体验区| 99久久精品国产一区二区| 亚洲日韩乱码中文无码蜜桃臀网站| 欧美精品网| 大色欧美| 亚洲男人最新版本天堂| 国产SUV精品一区二区33| 国产sm重味一区二区三区| 99热精品国产三级在线观看| 国产丝袜在线播放| 色道久久综合亚洲精品蜜桃| 日韩AV人人爽| A片网站免费观看| 免费无码无遮挡裸体视频在线观看 | 国产麻豆成人传媒免费观看| 成人国产一区二区三区精品| 五月丁香综合| 亚洲 欧美 日韩 国产 丝袜| 99精品国产综合久久久久五月天| 激情综合av| 香蕉97超级碰碰碰免费公开| 亚洲女人色综合小说| 久久精品无码一区二区三区不卡| 国产精品无码无需播放器| 中文字幕日韩人妻一区| 国产AⅤ爽aV久久久久成人| 亚洲欧美综合另类图片小说区| 一级α片午夜在线观看| 欧美熟妇乱子伦XX视频| 国产成人免费高清AⅤ|