記者 何暢
繼宣布將建成全球最大具身數據采集中心之后,京東在具身智能領域又有新動作。4月16日,京東舉辦具身智能生態發布會,發布具身智能數據基礎設施全景圖,覆蓋“采、存、標、訓、評、仿、測”,自研超高清采集終端JoyEgoCam、具身大模型JoyAI-RA、具身智能數據交易平臺等先后亮相。
![]()
當前,具身智能正在加速進入應用場景。但一個問題在于,缺乏高質量、可用性強、真實場景下交互的數據。由于硬件標準不一、數據采集流程分散,采集到的數據難以直接用于模型訓練。數據、硬件、算力和模型共同限制了具身智能所能發揮的作用,以至于人們往往調侃“只能看機器人翻跟頭、轉手絹”。
一直以來,京東都在強調供應鏈方面的優勢。某種程度上來說,隨著前述基礎設施的搭建和使用,京東希望打通從數據采集到模型測試的全流程閉環,將原始雜亂數據精煉為驅動模型進化的高價值“數據燃料”,并推動具身智能在零售、物流、物流、工業、健康等場景的規模化商業落地,打造自己的“具身智能超級供應鏈”。
京東稱,將發動最多60萬人進行數據采集行動,在兩年內積累1000萬小時人類真實場景視頻數據,由超過10萬京東員工和50萬外部協作人員共同參與,包括京東線下零售業態的店員、京東物流的快遞員、京東家政的保潔人員等。電廠了解到,除了采集設備,現階段京東也會為這些參與采集的人員提供一定的報酬。
談及當前數據采集的難點,京東集團副總裁、京東云基礎云業務總經理龔義成告訴電廠,首先是如何找到對具身模型有用、可定義、可規模化的數據,“采集的數據維度很重要”。其次是大規模數據的處理,涉及很強的技術性和成本的控制。除此之外,還需要考慮模型數據的飛輪,“數據對模型要有效”。
會上,京東云自研的可穿戴式超高清采集終端JoyEgoCam亮相。京東方面介紹,JoyEgoCam配備4K高清攝像頭,支持60幀幀率與130度超廣角拍攝,可實現毫秒級動作細節捕捉,重投影誤差小于0.2像素,整機重220克,內置車規級6軸IMU與多傳感器融合單元,可以“即戴即采”,讓普通人也能完成專業級數據采集。而除了通過頭部設備對數據進行采集,未來京東還將進行手部、肢體乃至整個動態軌跡的采集。
![]()
接下來的流程也相對清晰:經過采集的數據進入上傳和加工階段,匯入AI數據湖平臺后,經PB級吞吐能力自動完成清洗、對齊、轉換與預標注,轉為標準訓練集。JoyBuilder仿真平臺批量生成高逼真仿真數據,一站式實現人類操作數據→仿真操作數據→真機操作數據的高效數據增值轉換與泛化擴增。治理后的數據再匯聚至JoyBuilder模型開發平臺,自研AI算子矩陣貫穿始終,涵蓋去畸變、語義描述、深度重建等環節。目前,京東日處理數據量已達數十萬條,數據有效率達95%,整體處理成本降低60%。
模型反哺數據標注與采集,數據質量越高,模型迭代效率與精度越高。京東方面透露,以自采數據為核心訓練的京東具身大模型JoyAI-RA,在真機實驗上成功率達到73.5%。
同步上線的還有京東具身智能數據交易平臺,匯聚京東業務場景下的多模態數據資源,支持數據方、開發者、應用方多方協同。平臺首批定向開放2000小時高精標注數據集,技術社區也即將上線。
“京東認為整個具身領域發展到今天還是一個非常早期的階段,我們希望通過這樣千萬小時的數據采集項目,通過京東的微薄之力為整個行業做一點事,推動整個行業快速發展,也希望各位伙伴能夠加入我們的項目,一起推動具身行業繼續向前發展。”京東集團技術委員會主席、京東云總裁曹鵬說道。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.