<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      400萬條問答、四大推理模塊,這項成果被CVPR 2026收錄了

      0
      分享至

      在具身智能領域,一個問題正變得越來越尖銳:當一個機器人站在廚房里,它究竟應該先“看懂”這個世界,還是先“想清”下一步動作?

      過去,大量研究將這兩件事割裂開來,要么專注讓模型描述場景,要么埋頭優化動作序列。但在真實世界中,感知與決策本就是一體的。當機器人抓起一只杯子,它必須同時理解杯子的位置、杯中的液體、傾倒的角度和此刻是否該停止。任何一刻的猶豫或誤判,都意味著任務的失敗。

      北京大學副教授穆亞東及北京大學、星源智團隊給出了一套完整的答案。在即將召開的計算機視覺頂會CVPR 2026上,一篇題為《Extending Embodied Question Answering from Perception to Decision》的論文,首次將具身問答從靜態感知擴展到動態決策,提出了大規模數據集EQA-Decision與對應的RoboDecision訓練框架。

      該工作構建了覆蓋四大推理模塊、超過四百萬問答對的超大規模數據引擎,并設計出從監督微調到思維鏈再到強化學習的三階段訓練方法,讓模型真正學會“先想后做、看圖決策”,為具身智能的評測和能力建設立下了一道全新的基準線。



      論文鏈接:

      CVPR26_EQA.pdf

      01.

      EQA-Decision:一個為決策而生的百萬級數據引擎

      具身問答(Embodied Question Answering, EQA)自提出以來,一直被視為連接視覺感知、語言推理和物理交互的關鍵任務。然而,現有數據集和評測基準長期處于“各自為戰”的狀態,幾乎沒有一個大規模框架能將空間理解、狀態追蹤、因果推理和即時行動決策放在同一語境下統一考量。

      這種割裂帶來的后果是,即便是目前最先進的多模態大模型,在面對動態交互場景時也常常表現得像個“紙上談兵”的旁觀者。它們可以準確告訴你“桌子上的紅蘋果在碗的左邊”,卻很難在機器人抓取蘋果的過程中判斷“此刻是否已經抓穩”,更不用說“如果蘋果滑動了,下一步該調整什么動作”。

      而為了填補上述空白,研究團隊構建了EQA-Decision數據集,其體量超過四百萬個多模態問答對,數據來源橫跨模擬環境、圖像問答、第一人稱視頻和真實機器人軌跡四大類型。

      這些數據被系統性地組織成四大推理模塊,即靜態場景構建、空間理解、任務動態推理和即時決策,并在其下細分為九項子任務。



      其中,靜態場景構建模塊關注物體存在性、狀態、計數和位置等基本場景理解任務,為模型提供對環境的“第一眼認知”。

      空間理解模塊則從三個互補視角切入,包括深度與方向、定位與指代,以及行動可能性,幫助模型建立起“哪里是什么,哪里可以做什么”的空間直覺。

      這兩個模塊更貼近傳統意義上的感知能力,而真正讓該數據集區別于以往工作的,是任務動態推理和即時決策兩大模塊。

      任務動態推理包含了子任務規劃、狀態追蹤與因果推理、以及進度估計三個子類,這種引入時間進程和因果鏈條的設計,促使模型去理解動作的先后邏輯和任務狀態的演變。

      而最前沿的即時決策模塊,則將具身問答推向了真正的行動層面。該模塊專注于建模機器人在動態具身環境中的實時決策過程,模型需要在任務執行中的某一瞬間,綜合空間布局、子任務完成度和未來動作后果,完成一次從“看到”到“決定”的完整思維鏈路,給出此刻最合理的即時動作。

      比如,在“刷洗水瓶”的任務中,機器人傾斜瓶身倒水,水流仍在流出,此時模型應當回答“等待,直到水流停止”,而非急躁地進入下一步。

      正是任務動態推理和即時決策這兩個新引入的模塊,使 EQA-Decision 真正將具身問答從“靜態體檢”升級為“動態實戰”。

      02.

      RoboDecision:三階段訓練打造“感知-決策”統一體

      有了面向決策的數據集,還需要能真正消化這些數據的模型。團隊以Qwen3-VL-8B-Instruct為基座,提出了RoboDecision訓練框架,通過三階段遞進式訓練,逐步將通用多模態模型塑造成擅長具身推理與決策的專家。



      第一階段是SFT(監督微調),在EQA-Decision四大模塊上均勻采樣數據,對語言模型和跨模態融合層進行訓練,注入具身領域的先驗知識,從而提升基礎的空間、時間和決策推理能力。

      第二階段是CoT-SFT(思維鏈監督微調),團隊從各模塊均勻采樣約10%的數據,用Gemini生成包含推理依據和最終答案的結構化思維鏈標注,再進一步微調模型。這一步教會模型“先想后答”,形成顯式的多步推理和因果理解能力,也讓后續強化學習階段的獎勵信號更加穩定。

      第三階段則是GRPO(強化學習微調),這是RoboDecision框架真正將“感知”與“決策”焊死的環節。許多經過監督微調的模型會過度依賴文本先驗,導致即使視覺輸入發生變化,輸出依然相似,這在要求實時動作調整的具身任務中是致命的。

      為此,團隊設計了一種混合獎勵函數,綜合考察推理質量、答案正確性和視覺一致性三個維度。

      其中,推理獎勵用E5-large計算模型生成的推理鏈與參考思維鏈的相似度,鼓勵因果一致的空間和時間推理;答案獎勵則對自由文本回答采用語義相似度,對結構化輸出(如坐標、深度)則采用基于規則的評分函數;

      最具創新性的是視覺一致性獎勵,它用OpenCLIP對齊生成的推理與視覺觀察,確保模型的思考內容真正反映畫面中的視覺證據,而非靠文本先驗“瞎猜”。這迫使模型不再做一個“脫離畫面的空想家”,而是成為一個緊盯場景變化、根據視覺線索即時調整推理的“實干派”。

      這種將視覺對齊明確納入優化目標的思路,在具身模型訓練中尚屬前沿。它相當于在模型的決策回路里植入了一個持續的感官校驗機制,為構建可靠的動作生成系統提供了新的方法論。

      03.

      全面領先的評測結果:RoboDecision-8B超越GPT-5

      為了檢驗成果,團隊建立了一套統一的EQA-Decision Benchmark,涵蓋靜態場景理解、空間-深度推理、視覺指代、時間推理、規劃推理和即時決策六大維度,總計2118個精心篩選的評測樣本,且與訓練集嚴格隔離。



      結果顯示,RoboDecision-8B在整體得分上達到68.06,以顯著優勢超越了包括GPT-5(51.03)、Gemini-2.5-Pro(48.68)、Qwen3-VL-8B-Instruct(48.84)等在內的所有通用基線和具身基線模型。

      尤其值得關注的是兩個高難度維度的飛躍。在視覺指代定位任務上,RoboDecision得分 68.12,而Qwen3-VL-8B-Thinking僅23.14,差距懸殊的核心原因正是視覺一致性獎勵強制模型把推理錨定在圖像像素上。

      在即時決策任務上,RoboDecision得分 69.93,比最強基線GPT-5的62.25高出7.7個點,充分證明了“感知-決策”一體化訓練的有效性。

      此外,在RoboVQA、ERQA等域外具身基準測試上,RoboDecision-8B同樣展現出領先的泛化能力,證實了這套訓練框架的有效性并非局限于自家數據集。

      04.

      結語與未來

      具身智能的真正挑戰,是在動態世界中做出正確決策。此次星源智與北京大學團隊聯合提出的EQA-Decision與RoboDecision,正是從感知智能邁向決策智能的關鍵一步,為后續的科研合作、產業交流和高端人才聚集搭建了一座極具吸引力的技術燈塔。

      作為該工作的重要合作方,星源智為研究提供了寶貴的資源支持。CVPR 2026的錄用,不僅是學術層面的突破,更彰顯出公司在具身智能核心算法能力上的深厚積淀。

      未來,隨著這類“從感知到決策”的數據集與模型被更廣泛地應用于具身智能研究與機器人學習等領域,或許將看到,機器人不僅能夠理解世界,更學會如何做出正確的行動。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      奧尼爾低頭:巴克利說得對,布倫森就是歷史最佳自由簽約

      奧尼爾低頭:巴克利說得對,布倫森就是歷史最佳自由簽約

      甜份超標的我
      2026-06-16 00:19:44
      提幫功遞紙巾遭親姐一把推開,泰王沉默,詩妮娜躲在角落行大禮

      提幫功遞紙巾遭親姐一把推開,泰王沉默,詩妮娜躲在角落行大禮

      白露文娛志
      2026-06-16 16:39:58
      被男人玩夠就扔的女人都有一個通病:不是長得不夠好,不是對他不夠好,而是從頭到尾都沒碰到男人藏最深的兩處軟肋

      被男人玩夠就扔的女人都有一個通病:不是長得不夠好,不是對他不夠好,而是從頭到尾都沒碰到男人藏最深的兩處軟肋

      心理觀察局
      2026-06-07 06:37:04
      世界杯 法國VS塞內加爾 法國隊能否避免重演2002年噩夢?比分推薦

      世界杯 法國VS塞內加爾 法國隊能否避免重演2002年噩夢?比分推薦

      倚天足球
      2026-06-16 13:06:43
      中國家庭存款8級大曝光,70%的人卡在第6級,這道坎到底有多難過

      中國家庭存款8級大曝光,70%的人卡在第6級,這道坎到底有多難過

      愛看劇的阿峰
      2026-06-16 06:21:28
      善良是最好的財運,這4個生肖從不使壞,卻總有貴人送錢上門

      善良是最好的財運,這4個生肖從不使壞,卻總有貴人送錢上門

      毅談生肖
      2026-06-15 11:37:37
      境外勢力竟將海龜作“竊密工具”?

      境外勢力竟將海龜作“竊密工具”?

      風鈴草語
      2026-06-16 06:44:17
      人民法院案例庫:在交通事故中,非機動車一方不存在主觀故意的情況下,不宜支持保險人代位機動車一方向非機動車一方追償車損的請求權!

      人民法院案例庫:在交通事故中,非機動車一方不存在主觀故意的情況下,不宜支持保險人代位機動車一方向非機動車一方追償車損的請求權!

      微法官
      2026-06-15 13:41:00
      大廠職場:夢想遇冷與“調教”之痛

      大廠職場:夢想遇冷與“調教”之痛

      風鈴草語
      2026-06-16 06:52:25
      特朗普突然發了一張與金正恩的合影

      特朗普突然發了一張與金正恩的合影

      IN朝鮮
      2026-06-16 12:18:10
      青海海西州地震已致1死4傷

      青海海西州地震已致1死4傷

      界面新聞
      2026-06-16 18:58:13
      伊朗戰爭,全世界才知道我國掌握三個殺手锏,早就是世界第一了

      伊朗戰爭,全世界才知道我國掌握三個殺手锏,早就是世界第一了

      老瑗愛評論
      2026-05-01 20:58:20
      “我受不了了!不想再開人了,不想再裁員了”,一上海HR情緒崩潰

      “我受不了了!不想再開人了,不想再裁員了”,一上海HR情緒崩潰

      火山詩話
      2026-06-09 11:05:18
      魔力鳥直言西班牙病根:執著巴薩體系自陷誤區,輕視非洲隊吃大虧

      魔力鳥直言西班牙病根:執著巴薩體系自陷誤區,輕視非洲隊吃大虧

      體育閑話說
      2026-06-16 15:15:02
      陰謀論泛濫:預言虛妄丑態盡顯

      陰謀論泛濫:預言虛妄丑態盡顯

      風鈴草語
      2026-06-16 06:47:00
      大漲、大漲、再大漲!SpaceX上市連漲三天,馬斯克身家1.3萬億美元≈8.8個巴菲特

      大漲、大漲、再大漲!SpaceX上市連漲三天,馬斯克身家1.3萬億美元≈8.8個巴菲特

      每日經濟新聞
      2026-06-16 17:41:15
      名宿:這是史上天賦最出眾的挪威隊 哈蘭德是核心

      名宿:這是史上天賦最出眾的挪威隊 哈蘭德是核心

      仰臥撐FTUer
      2026-06-16 11:54:17
      隨著世界杯首輪接近尾聲,三大死亡之組顯現,兩大奪冠熱門告急!

      隨著世界杯首輪接近尾聲,三大死亡之組顯現,兩大奪冠熱門告急!

      吳猖旅行ing
      2026-06-17 00:47:43
      蘋果又被反壟斷調查了,這次是云服務問題

      蘋果又被反壟斷調查了,這次是云服務問題

      IT之家
      2026-06-16 15:28:11
      心理學上有一個真相:真正疲憊,往往不是體力透支,而是心力耗竭

      心理學上有一個真相:真正疲憊,往往不是體力透支,而是心力耗竭

      松果正念袁老師
      2026-03-14 20:33:17
      2026-06-17 02:16:49
      機器人大講堂 incentive-icons
      機器人大講堂
      立德機器人平臺,是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機器人垂直領域服務平臺
      6705文章數 4592關注度
      往期回顧 全部

      科技要聞

      DeepSeek融資500億,梁文鋒牢牢握住控制權

      頭條要聞

      四川警方私扣酒商159瓶茅臺 酒放庫房3年有的已成空瓶

      頭條要聞

      四川警方私扣酒商159瓶茅臺 酒放庫房3年有的已成空瓶

      體育要聞

      身價5萬的門將,擋住了12億歐元的狂轟濫炸

      娛樂要聞

      吳文忻葬禮:2個女兒在靈堂內茫然失措

      財經要聞

      從123美元到62美元 白銀價格上演過山車

      汽車要聞

      三車齊發 零跑全新C10/C11/C16上市12.58萬元起

      態度原創

      房產
      藝術
      健康
      數碼
      公開課

      房產要聞

      最新房價:海口、三亞;新房、二手房全線下跌!

      藝術要聞

      約旦最大的體育場開始建設,計劃2029年完工!

      粽子一次吃多少不傷胃?專家講解

      數碼要聞

      V社新Steam Machine跑分曝光,配置信息公布

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久国产欧美日韩高清专区| 伊人久久大香线蕉综合网站| wwww亚洲熟妇久久久久| 丁香激情网| 特黄少妇60分钟在线观看播放| 四虎精品视频永久免费| 亚洲一人综合| 亚洲欧美日韩久久精品| 国产精品麻豆成人av电影艾秋| 亚洲熟女一区二区av| 在线无码中文字幕水蜜桃一区| 国产国产国产国产系列| 最新中文字幕AV无码专区不| 成人看的污污超级黄网站免费 | 久久精品人人做人人| 欧洲无码一区二区三区在线观看| 日本中文字幕在线播放| 久久亚洲国产精品一区| 绵竹市| 国模吧一区| 国产精品露脸3p普通话| 97超级碰碰碰久久久久| 色色午夜天| 亚洲av午夜福利精品一区二区| 免费又大粗又爽又黄少妇毛片| 日韩国产欧美亚洲v片| 超碰人妻在线| 国产精品美腿一区在线看| 人妻系列无码专区免费| 丝袜美腿视频一区二区三区| 色吊丝亚洲欧美| 国产AV天堂亚洲国产AV天堂| 免费观看老外特级毛片| 性无码一区二区三区在线观看 | 欧美黑人少妇视频在线免费| 亚洲欧美精品狠狠干| 国产网友愉拍精品视频手机| 亚洲伊人久久大香线蕉| 大色欧美| 日日噜噜夜夜狠狠视频| 国产欧美另类久久精品蜜芽|