![]()
ROBOT INDUSTRY
隨著具身智能賽道持續升溫,數據短缺已成為行業最大挑戰之一。從運動控制到精細操作,從單一任務到復雜交互,機器人的每一次進化都依賴于海量、高質量的訓練數據。而如何采集這些數據、如何評測機器人的真實能力,正是動捕技術切入產業核心的突破口。
![]()
上海青瞳視覺科技有限公司(以下簡稱“青瞳視覺”)成立于2015年,是全球領先、面向全球市場的光學動作捕捉與多模態數據采集基礎設施提供商。
青瞳視覺創始人兼CEO張海威用一句話點明了青瞳視覺的核心定位:“動捕對于機器人而言,是生態鏈上的一個輔助角色,可以說是機器人的‘教練’或‘考官’—既提供高質量的數據供給,也負責能力評估與驗證。”從服務知名影視游戲與數字內容生產的動捕應用,到如今成為宇樹、智元等頭部具身智能企業的合作伙伴,青瞳視覺正完成從影視幕后工作者到機器人基礎設施建設者的角色轉變。
1
從“會動”到“能動好”的首席教練
![]()
在張海威看來,人形機器人的成長軌跡與人類有著驚人的相似:“剛開始是運動能力的發展,接下來是操作能力,最后是感知能力、協作能力。”這一“進化三部曲”的第一階段,正是運動智能的構建。
![]()
圖1 青瞳視覺創始人兼CEO 張海威
運動智能是機器人最基礎的生存能力,核心在于讓機器人掌握平衡與協調—走路時重心如何轉移、轉彎時關節如何配合、跑步時如何保持穩定。這些看似本能的能力,對機器人而言需要通過海量數據學習才能獲得。傳統機器人運動控制依賴工程師手動編程,效率低且泛化能力差。而動捕技術的價值在于,可以將人類運動數據“復刻”給機器人:動捕師穿戴設備做出各種動作,系統記錄關節角度、運動軌跡、重心變化,再通過算法映射到機器人身上。
青瞳視覺的光學動捕系統以亞毫米級精度實時捕捉機器人全身運動軌跡,支持多機器人復雜動作并行采集。在宇樹G1人形機器人的武術訓練中,青瞳視覺的動作捕捉設備記錄了人類武術運動員的髖關節、膝關節角度變化,以及重心轉移的時序數據,幫助機器人學會行云流水的武術動作。張海威指出:“研發運控算法時,在仿真里部署和到真機上的表現會有差距,或者說Gap有多大需要用動捕進行定量測量,幫助找到Gap所在,做運動調優、姿態調優。”
與慣性動捕相比,光學方案的最大優勢在于無累積誤差—每一幀解算的位置和角度都是確定的。但傳統光學動捕的致命缺陷是“怕遮擋”:當相機看不見標記點時,數據就會丟失。這一痛點在人形機器人場景中尤為突出,因為機器人的手指、關節很容易遮擋標記點。青瞳視覺的創新在于“光慣混合前融合”方案:不是光學和慣性分別解算后再融合,而是用兩者的底層數據聯合解算。“前融合是在深度融合中把雙方優點集成、缺點過濾,”張海威解釋,“松耦合方案就像5個專家各自打分再平均,缺點全疊加了;緊耦合方案就像5個專家一起討論打分,優點互補,缺點抵消。”
除了運動訓練,檢測同樣是動捕的重要價值。張海威指出,檢測有兩個應用場景:一是研發過程中,用動捕檢測機器人的運動狀態,輔助升級迭代控制算法;二是機器人進入量產環節后,需要對各項性能指標進行評價,看是否滿足出廠要求。“機器人有很多性能指標,其中最重要的就是運動能力。測試運動能力,目前看動捕是最直接、最高效的方式。”
2
解鎖五指靈巧手的精細密碼
![]()
在2026年春晚《武BOT》節目中,宇樹機器人的棍法對練環節令人印象深刻:機器人在高速運動中完成抓棍、捋棍、握棍三個步驟,牢牢握住棍子與小演員完成整套對練功夫。這正是操作智能的核心挑戰。
與運動控制相比,精細操作對數據精度和模態的要求呈指數級上升。張海威指出:“抓杯子,人類手指會根據杯子的形狀調整力度,指尖關節的彎曲角度誤差不能超過1度,傳統動捕根本做不到這么精準。”
![]()
圖2 青瞳視覺產品進行靈巧手操作研究
青瞳視覺的手指動捕方案實現了兩大技術突破:一是主動發光編碼Mark點,二是光慣混合手指捕捉。
編碼Mark點是青瞳視覺為手指操作做的技術革新。“通過編碼給每個光點打上獨特標簽,每個光點都有唯一ID,”張海威解釋,“這樣在做動捕時不會混淆—手指之間經常重疊交叉,如果不打標簽容易誤識別,數據變臟,有效數據減少,后期需要大量數據清理。”編碼Mark點保證數據非常干凈,沒有誤識別。
在手指捕捉領域,青瞳視覺的方案精度已達到行業領先水平。靈巧手檢測要求極高,關節精度需在0.5度以內,而靈巧手關節非常小,動作變形細微,達到0.5度很難。這套方案讓以前需要20多臺相機的光學動捕,現在2~3臺就夠了。相機數量減少80%,不僅降低了設備成本,還簡化了部署,讓工廠車間、家庭廚房都能快速搭建動捕環境。
與UMI、Ego-centric等技術路線相比,青瞳視覺的方案是全集的視角。張海威認為,UMI只采集夾爪位置和二指動作,Ego-centric只采集第一人稱視角下的雙手動作,“這兩者都是人體操作的一部分或簡化,而青瞳視覺提供的是人操作的全集—既包含動作、觸覺,也包含手的位置、肢體動作和物體信息,而且是五指的。五指數據可以遷移到兩指三指,但反過來很難。”在他看來,UMI和Ego-centric扛起了無本體采集的大旗,讓行業從遙操作轉向這條技術路線,但這兩個方案都是過渡性的,“最終要轉向全模態、高質量的方案。要真正指導機器人做操作,一定需要動作、觸覺、第一人稱視角、其他視角的圖像信息、被操作物體的信息。”
3
破解人形機器人的“數據饑渴癥”
![]()
人形機器人對數據的需求,遠超ChatGPT和自動駕駛—因為ChatGPT只需要文字數據,自動駕駛是“二維空間無交互”,而人形機器人是“三維空間強交互”,需要動作、觸覺、環境、物體屬性等多維度數據。對于“數據需求是自動駕駛1000倍”的說法,張海威認為“1000倍可能還是保守估計”。
這一判斷基于三點理由:第一,自動駕駛是準二維空間,具身操作是三維空間,維度提升帶來的復雜度遠非十倍;第二,自動駕駛是半結構化場景,任務明確、規則明確,而具身操作場景千奇百怪,千行百業各不相同;第三,也是最大的區別—具身智能要改變物理世界、發生交互,而語言大模型、視覺大模型、駕駛大模型都不改變物理世界。“從這個維度也會增加至少一個數量級。”
![]()
圖3 青瞳視覺進行全尺寸通用人形機器人“青龍“性能評測和數據采集
針對數據難題,青瞳視覺正在推進“高質量人形機器人數據集”建設,核心抓手是“數采工廠”。張海威透露:“我們正在全國各地籌劃建設‘數采工廠’,可能在幾個城市同時建廠,采集大量數據。”這一模式類似于自動駕駛行業的數據采集中心,讓數據在真實勞動過程中自然產生—這樣的數據成本最低,場景也足夠泛化。
高質量數據的第一個標準是“多模態”。以“擰螺絲”為例,除了手指關節的運動軌跡,還要采集指尖的壓力變化、螺絲的材質硬度、工作臺的高度。同時,這些數據必須實現“時空對齊”—所有模態要在同一時間和空間下。青瞳視覺的方案從硬件底層設計保證對齊:無論是光學、慣性還是觸覺,都在同一時鐘體系下同步觸發采集,各傳感器的時間戳一致。空間一致性方面,動捕相機和RGB相機共同校準、同時觸發,在空間坐標系上嚴格對齊。
高質量數據的第二個標準是“三高”:高精度、高靈敏度、高自由度。張海威強調:“如果數據集的自由度低,那么訓練出的機器人只能做簡單動作,沒法用工具、沒法適應不同場景。”在數據構成上,他認為“高質量數據肯定不是唯一的,但真人的無本體高質量數據一定是核心。所有大模型訓練都離不開高質量、全模態的數據訓練。在此基礎上補充仿真數據、泛化的低質量數據,可能有助于泛化性。”
4
構建機器人能力量化評測體系
![]()
對于人形機器人而言,技術路線仍在早期,設計并未收斂,沒有經過嚴格評測的動作,就是不安全的動作。這正是青瞳視覺“金牌考官”角色的核心價值。
在研發階段,動捕是機器人的性能調優工具。青瞳視覺的光學動捕系統可以記錄人形機器人髖關節、踝關節的運動軌跡,對比人類正常走路的數據,找出異常動作的根源—可能是膝關節的角度誤差,也可能是重心轉移的時機。張海威形容:“就像給機器人做動作CT,傳統調優靠肉眼觀察,誤差大、效率低,而動捕能把動作精度控制在亞毫米級,調優效率提升10倍以上。”
![]()
圖4 青瞳視覺光慣混合動捕方案
到了量產階段,動捕變成“質檢官”。機器人有很多性能指標,其中運動能力是最重要環節之一。張海威指出,“現在強化學習的運控方法對機器人一致性要求較高,這些都是動捕可以賦能的”。通過動捕檢測機器人的運動狀態,可以量化評估其是否滿足出廠要求。
更深層的評測是對機器人操作能力和感知能力的量化。靈巧手技能的檢測是一大難點:讓機器人干活,干得好不好目前缺乏標準,大家更多關注成功率,沒有過多關注質量、完成效率、時間等。張海威認為,“動捕可以在很多方面做檢測和評價”。此外,還可以讓機器人在仿真環境中執行任務、與環境交互,用動捕監測其狀態,評估感知能力和交互能力。“直白說就是讓機器人戴VR眼鏡—當然機器人不需要戴眼鏡,只要放進仿真環境,本質上和人戴VR眼鏡玩游戲一樣。動捕檢測機器人玩游戲時的表現,評估其感知、協同、規劃能力。”
對于機器人的后期維護,動捕同樣可以發揮作用。張海威展望:“如果機器人真正進入千行百業,在使用過程中也需要檢測和標定。在工業場景,如果更換零部件、摔跤、長期工作疲勞導致關節形變或齒輪間隙變化,仍需要檢測和標定。”這是動捕技術尚未規模化應用但潛力巨大的方向。
關于成本問題,張海威有著清醒的認識:“成本一定是綜合考量,不能只看硬件成本。UMI、Ego-centric也好,動捕也好,都是數采設備,生產的是數據產品。對生產力工具,要看綜合使用成本。”隨著硬件鋪開形成規模,成本也可以大幅降低——青瞳視覺2023年發布的普羅米修斯產品已進入萬元級別,“成本已經和慣性動捕產品在同一水平線了”。
閱讀更多內容,歡迎訂購《機器人產業》雜志。
點擊跳轉!圈內人都在看的專家觀點
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.