網易首頁 > 網易號 > 正文申請入駐

炸場具身智能圈！覓蜂 MEgo 無本體數采發布，捅破了機器人落地最大的窗戶紙 | 前沿在線

2026-05-07 23:54:03　來源: 前沿在線

北京舉報

分享至

編輯：前沿在線編輯部

就在最近，上海張江科學會堂，具身智能圈迎來了一場顛覆性的發布會。

沒有卷人形機器人的關節靈活度，沒有刷新具身大模型的 SOTA 榜單，覓蜂科技（Maniformer）用一套MEgo系列新品，直接掀了行業的底層邏輯桌子 —— 徹底打破物理 AI 數據采集對機器人本體的百年依賴，宣告具身智能數據生產正式進入「無本體、全場景、規模化」的新紀元。

這場以「蜂行天下，數驅智能」為主題的發布會，不止是一次硬件新品秀。從MEgo 無本體采集硬件、MEgo Engine 一站式數據治理平臺，到聯合數十家機構啟動的蜂巢數據共創行動，再與阿里云、百度云、京東云等頭部企業完成戰略簽約，覓蜂科技用一套組合拳，給困在「數據荒漠」里的具身智能行業，遞上了一把破局的鑰匙。

先劃3 個行業級核心結論，看完你就懂這場發布會為什么震動了整個圈子：

釜底抽薪式破局：徹底推翻「機器人本體綁定數據采集」的傳統范式，從「機器定點采數據」變成「人走到哪，數據采到哪」，采集效率直接翻 2-3 倍，成本砍半，場景覆蓋邊界無限拓寬。
打通行業最大死穴：與精靈 G2 Air原生同構設計，從根源解決了 UMI 數據「采了用不了」的行業頑疾，采集數據可無縫部署到機器人真機，徹底打通「采集 - 訓練 - 落地」全鏈路。
改寫賽道競爭格局：從單一的數據服務商，升級為具身智能時代的「數據水電廠」，用平臺化生態整合全行業產能，2026 年千萬小時、2030 年百億小時的產能規劃，直接給行業定下了新標尺。

做具身智能的都懂，我們被「本體綁定」坑了多少年？

在拆解 MEgo 的顛覆性之前，我們必須先回答一個靈魂問題：喊了這么多年「具身智能爆發」，為什么它始終困在實驗室里，走不進工廠、家庭、商超這些真實場景？

答案藏在一組扎心的數字里：當前全球具身智能行業的高質量真機交互數據總量，不足頭部大語言模型訓練語料的兩萬分之一。

GPT-5 的訓練語料規模達到 100 萬億 tokens，折算下來相當于 100 億小時的語音時長；而整個具身智能行業，能拿得出手的高質量訓練數據，滿打滿算只有50萬小時。

這道數量級的天塹，就是橫亙在具身智能面前的最大鴻溝。而鎖住數據產能的，正是行業沿襲多年的「本體綁定式采集」邏輯。

長期以來，物理 AI 的數據采集，被牢牢鎖死在「定制化機械臂+專用傳感器 +固定工位」的實體機器人本體上，這套模式給行業挖了四個繞不開的深坑，層層鎖死了產業規模化落地的可能。

第一個坑，場景邊界被本體焊死。傳統采集方案不僅設備成本動輒數十萬、部署周期長達數月，更受限于機器人的活動半徑與本體形態，根本覆蓋不了家庭、戶外、商超這些真實世界里復雜、動態、非結構化的場景。機器人走不到的地方，就是數據采集的天花板。

第二個坑，供需兩端徹底錯配。供給側，全國落地的數采中心手握硬件與場景資源，卻大多陷入「為了運營而運營」的怪圈，重復采集無效數據，空有產能卻無法實現商業變現，大量機器人長期處于閑置狀態；

需求側，大模型公司、機器人廠商已經開啟數據軍備競賽，普遍開出百萬小時級的年采購訂單，卻找不到能穩定、規模化交付高質量數據的服務商，算法迭代被數據供給嚴重拖慢。

第三個坑，標準缺失，數據孤島遍地。各家數據生產方的采集格式、標注規范、坐標系定義完全自成體系，算法團隊拿到不同來源的數據，要花大量時間做格式轉換、標準統一，協作成本高到離譜。

更致命的是，沒有統一標準就沒有統一的質量評判體系，「垃圾數據進，垃圾模型出」成了行業常態，很多優秀算法甚至因為劣質數據被提前判了死刑。

第四個坑，采了白采，用不了。傳統異構采集方案產出的數據，與機器人真機運行的數據分布存在天然差異，算法團隊用采集的數據訓完模型，部署到真機上完全無法復現效果。這也是整個行業最頭疼的靈魂拷問：我們采了這么多數據，為什么機器人還是學不會干活？

「算法再強，無數據則無源；愿景再美，無基建則空懸。」姚卯青在發布會上的這句話，道破了整個行業的核心困境。當大語言模型已經沖進認知智能的深水區，具身智能卻還在為基礎的訓練數據發愁。

所有人都清楚：不打破本體對數據采集的枷鎖，具身智能永遠只能是實驗室里的 Demo。

毫米級精度 + 亞毫秒同步，MEgo 到底解決了哪些行業頑疾？

覓蜂科技給出的破局答案，是「無本體數采」這套釜底抽薪式的方案，核心是徹底重構了物理 AI 數據生產的底層邏輯 ——從「以機器人本體為核心」，徹底轉向「以人為核心」。

MEgo 的命名里就藏著這套邏輯的全部內涵：

ME：以人為核心，把人作為數據采集的主體，人類在真實場景中的每一次操作、每一個交互，都能被精準轉化為高質量訓練數據；
go：隨行、輕量、無界，可隨身攜帶的采集系統，打破空間與場景限制，真正實現「走到哪、采到哪」；
M+Ego：融合覓蜂全鏈路數據治理能力與第一視角伴隨式采集，實現從采集、重建、質檢、標注到交付的全流程閉環。

這套邏輯不是空中樓閣，而是靠兩款硬核硬件 + 一個全流程平臺，精準命中了行業的每一個痛點。

MEgo Gripper：把行業軌跡精度，從厘米級拉到 1 毫米級

這款僅480g的輕量化多模態采集夾爪，一出手就刷新了行業的精度天花板。

做 UMI 采集的從業者都懂，軌跡還原精度就是數據的生命線。此前行業通用方案的軌跡還原誤差普遍在數厘米級，只能復刻粗略的動作，根本滿足不了擰螺絲、插拔物件這類精細操作的采集需求。

而MEgo Gripper直接把軌跡還原精度做到了1 毫米，人類手部的每一個細微操作，都能被完整記錄、1:1 復刻到機器人本體上。

更關鍵的是它實現了亞毫秒級全局無線時間同步。具身智能數據的核心，是視覺、觸覺、姿態、力覺等多模態數據的時空對齊——如果不同傳感器的數據不在同一個時間維度精準匹配，模型學到的就是不具備因果性的錯誤信息。

MEgo Gripper通過硬件級同步觸發與全局曝光技術，不僅實現了多傳感器的亞毫秒級對齊，還消除了高速移動中的畫面果凍效應，完整復刻物理交互的每一個細節。

同時，它搭載200° 魚眼鏡頭與三維觸覺陣列，全通道支持 1080P 60fps 高清視頻流，搭配 Wi-Fi 6 高速傳輸，可輸出視覺、深度、IMU、運動軌跡、多維觸覺在內的全維度交互數據，還能與MEgo View原生協同作業。

MEgo View：300° 全景 + 腕部特寫，環境與細節終于能兼顧了

這款行業首創的全場景空間感知采集終端，直接解決了行業長期以來「環境全景與操作細節無法兼顧」的痛點。

它采用了「超 300° 全景感知 + 腕部交互特寫」的雙視角采集方案：頭部 5 個相機實現 300° 超廣域環境覆蓋，完整捕捉操作所處的全局環境信息；腕部相機精準聚焦手部操作的細節特寫，不放過任何一個精細動作。

全通道 7 個攝像頭均支持全局曝光與 1080P 60fps 高清視頻流，搭配車規級九軸 IMU，實現了全域空間信息的完整采集。

和MEgo Gripper一樣，它也實現了亞毫秒級無線時間同步與硬件級精準觸發，徹底解決了多視角數據時空難以統一的行業頑疾。

再加上全無線、電池快換的輕量化設計，哪怕是工業產線、戶外作業這類復雜工況，也能靈活部署，真正實現「隨行即采」。

而最讓行業振奮的，是MEgo 全系列產品與智元精靈 G2 Air 的原生同構設計。

這一設計直接擊穿了無本體采集最大的行業壁壘：采集數據與真機數據不同源，導致「采了用不了」。

原生同構從源頭保障了 UMI 采集數據與真機數據的同源共生，基于 MEgo 采集的數據訓練的模型，可無縫對接部署到精靈 G2 Air 上，徹底打通了「采集 - 訓練 - 部署」的全鏈路，讓無本體采集的數據，真正能轉化為機器人的落地能力。

MEgo Engine：一鍵打通從原始數據到訓練數據集的全流程

如果說硬件終端解決了「數據從哪里來」的問題，MEgo Engine一站式數據治理平臺，就解決了「數據到哪里去」的核心難題。

傳統數據采集行業，普遍存在「采治脫節」的頑疾：采集終端只負責輸出原始數據，后續的對齊、清洗、標注、質檢，全靠需求方自己完成，效率極低，數據浪費嚴重。而MEgo Engine實現了全流程自動化處理，形成了完整閉環：

預處理環節：多源數據時間對齊、智能篩選，解決數據不同步、無效數據冗余的痛點；
空間感知環節：6D 軌跡重建、人體關鍵點重建與三維環境重建，1:1 還原真實操作的空間邏輯與動作細節；
質量評估環節：多本體回放、智能評分模型，實現數據質量自動化校驗，確保符合工業級訓練標準；
智能標注環節：把傳統人工標注效率提升 10 倍以上，實現數據治理的自動化、標準化、規模化。

更重要的是，平臺可直接對接MEgo 全系列采集終端，采集數據一鍵上傳即可完成全流程治理，直接輸出可用于模型訓練的標準化數據集。

哪怕是沒有專業數據治理團隊的初創企業，也能快速拿到開箱即用的高質量訓練數據，徹底拉低了具身智能算法研發的門檻。

不止賣硬件賣數據，覓蜂在下一盤多大的棋？

如果只把 MEgo 的發布看作一次硬件新品上市，顯然低估了覓蜂的野心。

這家從智元機器人體系中孵化出來的企業，從一開始的定位就不是「數據供應商」，而是全球領先的一站式物理 AI 數據服務平臺—— 它要做的，是具身智能時代的「國家電網」，讓高質量物理 AI 數據像水電一樣即取即用。

這套平臺化的定位，首先體現在它清晰可落地的商業與產能規劃上。

商業模式上，覓蜂堅定走 2B 定制化服務路線，核心客群覆蓋大模型公司、具身智能海內外大廠、初創企業。

不同于行業內簡單的「按小時賣數據」，它提供的是從需求對接、任務設計、標準化采集、全流程治理到交付驗收的全鏈條閉環服務，可滿足客戶從宏觀場景分類到精細化操作的全維度定制需求。

定價體系上，它也給行業建立了清晰的標尺：當前國內真機數據的主流交易價格為500-1000 元 / 小時，而無本體數據憑借更高的采集效率、更低的成本，未來價格將收斂至真機數據的 1/2-1/3，大幅降低行業的數據獲取成本。

同時，它明確劃分了數據使用權與所有權兩類交易模式，針對采購所有權的客戶，會完成嚴格的資產轉移與本地數據銷毀，從根本上保障客戶權益。

產能規劃上，覓蜂給出了明確的路線圖：2026 年實現千萬小時級數據產能，其中 60%-70% 來自無本體采集；2030 年實現百億小時級數據產能，達到當前大語言模型訓練語料的供給規模。

要實現這個看似激進的目標，靠的不是重資產的自營擴張，而是「自營中試 + 加盟代工 + 規范化眾包」的輕資產模式。

姚卯青在采訪中直言，覓蜂自身僅保留一兩百人的核心團隊，負責0-1 的樣板打造、流程規范與標準制定，相當于一個「中試基地」；而規模化產能，將通過加盟代工廠的模式實現 —— 合作伙伴負責固定資產投資與團隊組建，覓蜂提供全流程的標準、培訓、訂單與質量管理體系，打造「數據代工廠」網絡。

而針對行業熱議的眾包模式，覓蜂也給出了清晰的規劃：未來參考美團騎手的「培訓 + 管理」體系，在嚴格的標準規范與隱私保護機制下，推動眾包采集落地。這意味著，未來每一個普通人，都有可能成為具身智能數據的生產者，徹底打開數據產能的天花板。

比產能布局更具行業影響力的，是同步啟動的蜂巢數據共創行動。

這項由覓蜂聯合上電科、國家數據標委會、工信部賽迪研究院共同發起的行業行動，吸引了數十家海內外機構成為首批響應單位，核心目標直指行業三大痛點：打破數據孤島、統一數據標準、鏈接全球供需。

蜂巢行動設計了五大核心落地動作：

1、共享資源，接入全球供需網絡、共享海量訂單；

2、共建標準，牽頭建立行業統一的數據標準與規范；

3、生態合作，優先與成員伙伴共建軟硬件與數據生態；

4、行業發聲，聯合發布行業白皮書與技術報告；

5、產業推動，共享技術、資本、市場資源，共同推動產業規模化爆發。

它的本質，是把行業內分散的采集產能、場景資源、技術能力整合起來，形成一個開放、高效、標準化的物理 AI 數據流通網絡。

姚卯青用一個很直白的類比解釋了它的定位：覓蜂就像「滴滴」，既有自營車隊，也有大量三方運力，核心是搭建供需兩端的橋梁，讓供給方的資源高效變現，讓需求方快速拿到高質量數據。

而針對行業最關心的「覓蜂與智元的關系」問題，姚卯青也給出了明確答案：二者完全市場化解耦，智元與其他客戶一樣，需要通過市場化采購的方式才能從覓蜂獲取數據，不存在任何特殊權限。

這一設計，從根本上保障了覓蜂作為第三方數據平臺的獨立性，哪怕是與智元處于競爭關系的機器人廠商，也可以放心合作。

路線之爭終局落定：具身智能的未來，到底需要什么樣的數據？

MEgo 的發布，也把行業長期爭論的核心問題推到了臺前：真機采集、無本體采集、仿真數據，到底哪條路線才是具身智能的終局？

在發布會的圓桌論壇上，來自數據平臺、模型廠商、仿真企業、科研機構的行業大咖，給出了一致的答案：三者絕非對立替代關系，而是互補共生關系，共同構成了具身智能的數據金字塔。

在這個金字塔中，塔尖是真機采集數據。它的質量最高、針對性最強，是具身智能落地真實場景的剛需。

要讓機器人在工業產線、家庭場景中實現 100% 的任務成功率，必須依賴與落地機器人同構、同場景的數據，保障數據分布與真機運行完全匹配，這是無本體與仿真數據無法替代的。

金字塔的中間層，是本次發布會引爆的無本體采集數據。

它的核心優勢是采集效率高、場景覆蓋廣、成本低，采集效率是真機的 2-3 倍，未來成本僅為真機的 1/3。它最核心的價值，是為模型預訓練、表征學習、世界模型訓練提供海量、多樣化的基礎數據，解決行業基礎數據供給不足的核心痛點，讓模型先學會人類操作的通用邏輯與物理世界的基本規律。

而金字塔的底座，是仿真數據。

它的核心價值是數據增廣、反事實場景構建與模型規模化評測。但姚卯青也直言，仿真數據有天然的局限：仿真場景中的資產建模，需要建模師純手工打造，一個杯子的建模成本甚至比真實杯子還高，真實世界里的海量物體與場景，根本無法通過仿真完全覆蓋；

同時，仿真數據永遠無法 1:1 復刻真實世界的物理規律與隨機變量，只能作為真實數據的補充，無法成為主流。

這場路線之爭的背后，是整個行業對具身智能發展階段的清晰認知。業內已經形成共識：2026 年是具身智能數據元年，當前的具身智能，仍處于大語言模型當年的Bert時代，距離GPT級的智能涌現，仍需要 3-4 年的時間。而決定這個時間能否提前的核心變量，就是數據供給的規模化、標準化進程。

姚卯青在發布會上給出了明確預判：2026 年底，全產業有效數據量級將突破千萬小時；到 2030 年，行業需要百億小時級的高質量數據，才能真正迎來具身智能的「GPT-3 時刻」，實現通用能力的涌現。而這個過程中，行業的核心競爭，將從「本體軍備競賽」，全面轉向「數據軍備競賽」。

這也解釋了，為什么智元要分拆覓蜂，全力布局數據基建賽道。當整個行業都在扎堆卷機器人本體、卷算法的時候，智元已經看清了終局：具身智能的天花板，從來不是本體的靈巧度，而是數據的供給能力。

就像大語言模型時代，最終最先穩定盈利的，是英偉達這樣賣鏟子的算力基建廠商；具身智能時代，最先實現商業閉環、掌握行業話語權的，一定是數據基建的服務商。

具身智能的基建革命，元年的第一聲槍響

這場發布會，最值得關注的，從來不是一款新硬件，而是整個具身智能行業的底層邏輯變了。

之前所有人都在卷「機器人本體有多厲害」，但沒人解決「機器人怎么學會干活」的底層問題 ——沒有海量、高質量、全場景的數據，再靈巧的本體，也只是個沒有靈魂的鐵殼子。

覓蜂 MEgo的出現，不是給這個賽道添了一個新玩家，而是給整個行業修了一條高速公路。

它徹底打破了機器人本體對數據采集的枷鎖，讓數據采集從實驗室的固定工位，走向了真實世界的每一個角落；

它用標準化的平臺與生態，終結了行業的數據孤島亂象；它讓「高質量數據像水電一樣即取即用」，從一句口號，變成了觸手可及的現實。

2026 年被稱為具身智能數據元年，而這場發布會，就是元年的第一聲槍響。當數據荒漠迎來甘霖，困在實驗室里的具身智能，終于要走進真實的人間煙火了。

前沿動態前沿大會
前沿人物

點「在看」，給前前加雞腿

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.