![]()
![]()
編輯:前沿在線 編輯部
就在最近,上海張江科學會堂,具身智能圈迎來了一場顛覆性的發布會。
![]()
沒有卷人形機器人的關節靈活度,沒有刷新具身大模型的 SOTA 榜單,覓蜂科技(Maniformer)用一套MEgo系列新品,直接掀了行業的底層邏輯桌子 —— 徹底打破物理 AI 數據采集對機器人本體的百年依賴,宣告具身智能數據生產正式進入「無本體、全場景、規模化」的新紀元。
![]()
這場以「蜂行天下,數驅智能」為主題的發布會,不止是一次硬件新品秀。從MEgo 無本體采集硬件、MEgo Engine 一站式數據治理平臺,到聯合數十家機構啟動的蜂巢數據共創行動,再與阿里云、百度云、京東云等頭部企業完成戰略簽約,覓蜂科技用一套組合拳,給困在「數據荒漠」里的具身智能行業,遞上了一把破局的鑰匙。
先劃3 個行業級核心結論,看完你就懂這場發布會為什么震動了整個圈子:
![]()
釜底抽薪式破局:徹底推翻「機器人本體綁定數據采集」的傳統范式,從「機器定點采數據」變成「人走到哪,數據采到哪」,采集效率直接翻 2-3 倍,成本砍半,場景覆蓋邊界無限拓寬。
打通行業最大死穴:與精靈 G2 Air原生同構設計,從根源解決了 UMI 數據「采了用不了」的行業頑疾,采集數據可無縫部署到機器人真機,徹底打通「采集 - 訓練 - 落地」全鏈路。
改寫賽道競爭格局:從單一的數據服務商,升級為具身智能時代的「數據水電廠」,用平臺化生態整合全行業產能,2026 年千萬小時、2030 年百億小時的產能規劃,直接給行業定下了新標尺。
![]()
做具身智能的都懂,我們被「本體綁定」坑了多少年?
在拆解 MEgo 的顛覆性之前,我們必須先回答一個靈魂問題:喊了這么多年「具身智能爆發」,為什么它始終困在實驗室里,走不進工廠、家庭、商超這些真實場景?
答案藏在一組扎心的數字里:當前全球具身智能行業的高質量真機交互數據總量,不足頭部大語言模型訓練語料的兩萬分之一。
GPT-5 的訓練語料規模達到 100 萬億 tokens,折算下來相當于 100 億小時的語音時長;而整個具身智能行業,能拿得出手的高質量訓練數據,滿打滿算只有50萬小時。
![]()
這道數量級的天塹,就是橫亙在具身智能面前的最大鴻溝。而鎖住數據產能的,正是行業沿襲多年的「本體綁定式采集」邏輯。
長期以來,物理 AI 的數據采集,被牢牢鎖死在「定制化機械臂+專用傳感器 +固定工位」的實體機器人本體上,這套模式給行業挖了四個繞不開的深坑,層層鎖死了產業規模化落地的可能。
![]()
第一個坑,場景邊界被本體焊死。傳統采集方案不僅設備成本動輒數十萬、部署周期長達數月,更受限于機器人的活動半徑與本體形態,根本覆蓋不了家庭、戶外、商超這些真實世界里復雜、動態、非結構化的場景。機器人走不到的地方,就是數據采集的天花板。
![]()
第二個坑,供需兩端徹底錯配。供給側,全國落地的數采中心手握硬件與場景資源,卻大多陷入「為了運營而運營」的怪圈,重復采集無效數據,空有產能卻無法實現商業變現,大量機器人長期處于閑置狀態;
![]()
需求側,大模型公司、機器人廠商已經開啟數據軍備競賽,普遍開出百萬小時級的年采購訂單,卻找不到能穩定、規模化交付高質量數據的服務商,算法迭代被數據供給嚴重拖慢。
![]()
第三個坑,標準缺失,數據孤島遍地。各家數據生產方的采集格式、標注規范、坐標系定義完全自成體系,算法團隊拿到不同來源的數據,要花大量時間做格式轉換、標準統一,協作成本高到離譜。
更致命的是,沒有統一標準就沒有統一的質量評判體系,「垃圾數據進,垃圾模型出」成了行業常態,很多優秀算法甚至因為劣質數據被提前判了死刑。
![]()
第四個坑,采了白采,用不了。傳統異構采集方案產出的數據,與機器人真機運行的數據分布存在天然差異,算法團隊用采集的數據訓完模型,部署到真機上完全無法復現效果。這也是整個行業最頭疼的靈魂拷問:我們采了這么多數據,為什么機器人還是學不會干活?
![]()
「算法再強,無數據則無源;愿景再美,無基建則空懸。」姚卯青在發布會上的這句話,道破了整個行業的核心困境。當大語言模型已經沖進認知智能的深水區,具身智能卻還在為基礎的訓練數據發愁。
所有人都清楚:不打破本體對數據采集的枷鎖,具身智能永遠只能是實驗室里的 Demo。
![]()
毫米級精度 + 亞毫秒同步,MEgo 到底解決了哪些行業頑疾?
覓蜂科技給出的破局答案,是「無本體數采」這套釜底抽薪式的方案,核心是徹底重構了物理 AI 數據生產的底層邏輯 ——從「以機器人本體為核心」,徹底轉向「以人為核心」。
MEgo 的命名里就藏著這套邏輯的全部內涵:
![]()
ME:以人為核心,把人作為數據采集的主體,人類在真實場景中的每一次操作、每一個交互,都能被精準轉化為高質量訓練數據;
go:隨行、輕量、無界,可隨身攜帶的采集系統,打破空間與場景限制,真正實現「走到哪、采到哪」;
M+Ego:融合覓蜂全鏈路數據治理能力與第一視角伴隨式采集,實現從采集、重建、質檢、標注到交付的全流程閉環。
這套邏輯不是空中樓閣,而是靠兩款硬核硬件 + 一個全流程平臺,精準命中了行業的每一個痛點。
![]()
MEgo Gripper:把行業軌跡精度,從厘米級拉到 1 毫米級
這款僅480g的輕量化多模態采集夾爪,一出手就刷新了行業的精度天花板。
![]()
做 UMI 采集的從業者都懂,軌跡還原精度就是數據的生命線。此前行業通用方案的軌跡還原誤差普遍在數厘米級,只能復刻粗略的動作,根本滿足不了擰螺絲、插拔物件這類精細操作的采集需求。
![]()
而MEgo Gripper直接把軌跡還原精度做到了1 毫米,人類手部的每一個細微操作,都能被完整記錄、1:1 復刻到機器人本體上。
![]()
更關鍵的是它實現了亞毫秒級全局無線時間同步。具身智能數據的核心,是視覺、觸覺、姿態、力覺等多模態數據的時空對齊——如果不同傳感器的數據不在同一個時間維度精準匹配,模型學到的就是不具備因果性的錯誤信息。
![]()
MEgo Gripper通過硬件級同步觸發與全局曝光技術,不僅實現了多傳感器的亞毫秒級對齊,還消除了高速移動中的畫面果凍效應,完整復刻物理交互的每一個細節。
![]()
同時,它搭載200° 魚眼鏡頭與三維觸覺陣列,全通道支持 1080P 60fps 高清視頻流,搭配 Wi-Fi 6 高速傳輸,可輸出視覺、深度、IMU、運動軌跡、多維觸覺在內的全維度交互數據,還能與MEgo View原生協同作業。
MEgo View:300° 全景 + 腕部特寫,環境與細節終于能兼顧了
這款行業首創的全場景空間感知采集終端,直接解決了行業長期以來「環境全景與操作細節無法兼顧」的痛點。
![]()
它采用了「超 300° 全景感知 + 腕部交互特寫」的雙視角采集方案:頭部 5 個相機實現 300° 超廣域環境覆蓋,完整捕捉操作所處的全局環境信息;腕部相機精準聚焦手部操作的細節特寫,不放過任何一個精細動作。
![]()
全通道 7 個攝像頭均支持全局曝光與 1080P 60fps 高清視頻流,搭配車規級九軸 IMU,實現了全域空間信息的完整采集。
![]()
和MEgo Gripper一樣,它也實現了亞毫秒級無線時間同步與硬件級精準觸發,徹底解決了多視角數據時空難以統一的行業頑疾。
![]()
再加上全無線、電池快換的輕量化設計,哪怕是工業產線、戶外作業這類復雜工況,也能靈活部署,真正實現「隨行即采」。
![]()
而最讓行業振奮的,是MEgo 全系列產品與智元精靈 G2 Air 的原生同構設計。
這一設計直接擊穿了無本體采集最大的行業壁壘:采集數據與真機數據不同源,導致「采了用不了」。
原生同構從源頭保障了 UMI 采集數據與真機數據的同源共生,基于 MEgo 采集的數據訓練的模型,可無縫對接部署到精靈 G2 Air 上,徹底打通了「采集 - 訓練 - 部署」的全鏈路,讓無本體采集的數據,真正能轉化為機器人的落地能力。
![]()
MEgo Engine:一鍵打通從原始數據到訓練數據集的全流程
如果說硬件終端解決了「數據從哪里來」的問題,MEgo Engine一站式數據治理平臺,就解決了「數據到哪里去」的核心難題。
![]()
傳統數據采集行業,普遍存在「采治脫節」的頑疾:采集終端只負責輸出原始數據,后續的對齊、清洗、標注、質檢,全靠需求方自己完成,效率極低,數據浪費嚴重。而MEgo Engine實現了全流程自動化處理,形成了完整閉環:
預處理環節:多源數據時間對齊、智能篩選,解決數據不同步、無效數據冗余的痛點;
空間感知環節:6D 軌跡重建、人體關鍵點重建與三維環境重建,1:1 還原真實操作的空間邏輯與動作細節;
質量評估環節:多本體回放、智能評分模型,實現數據質量自動化校驗,確保符合工業級訓練標準;
智能標注環節:把傳統人工標注效率提升 10 倍以上,實現數據治理的自動化、標準化、規模化。
更重要的是,平臺可直接對接MEgo 全系列采集終端,采集數據一鍵上傳即可完成全流程治理,直接輸出可用于模型訓練的標準化數據集。
![]()
哪怕是沒有專業數據治理團隊的初創企業,也能快速拿到開箱即用的高質量訓練數據,徹底拉低了具身智能算法研發的門檻。
![]()
不止賣硬件賣數據,覓蜂在下一盤多大的棋?
如果只把 MEgo 的發布看作一次硬件新品上市,顯然低估了覓蜂的野心。
這家從智元機器人體系中孵化出來的企業,從一開始的定位就不是「數據供應商」,而是全球領先的一站式物理 AI 數據服務平臺—— 它要做的,是具身智能時代的「國家電網」,讓高質量物理 AI 數據像水電一樣即取即用。
![]()
這套平臺化的定位,首先體現在它清晰可落地的商業與產能規劃上。
![]()
商業模式上,覓蜂堅定走 2B 定制化服務路線,核心客群覆蓋大模型公司、具身智能海內外大廠、初創企業。
不同于行業內簡單的「按小時賣數據」,它提供的是從需求對接、任務設計、標準化采集、全流程治理到交付驗收的全鏈條閉環服務,可滿足客戶從宏觀場景分類到精細化操作的全維度定制需求。
定價體系上,它也給行業建立了清晰的標尺:當前國內真機數據的主流交易價格為500-1000 元 / 小時,而無本體數據憑借更高的采集效率、更低的成本,未來價格將收斂至真機數據的 1/2-1/3,大幅降低行業的數據獲取成本。
![]()
同時,它明確劃分了數據使用權與所有權兩類交易模式,針對采購所有權的客戶,會完成嚴格的資產轉移與本地數據銷毀,從根本上保障客戶權益。
產能規劃上,覓蜂給出了明確的路線圖:2026 年實現千萬小時級數據產能,其中 60%-70% 來自無本體采集;2030 年實現百億小時級數據產能,達到當前大語言模型訓練語料的供給規模。
![]()
要實現這個看似激進的目標,靠的不是重資產的自營擴張,而是「自營中試 + 加盟代工 + 規范化眾包」的輕資產模式 。
姚卯青在采訪中直言,覓蜂自身僅保留一兩百人的核心團隊,負責0-1 的樣板打造、流程規范與標準制定,相當于一個「中試基地」;而規模化產能,將通過加盟代工廠的模式實現 —— 合作伙伴負責固定資產投資與團隊組建,覓蜂提供全流程的標準、培訓、訂單與質量管理體系,打造「數據代工廠」網絡。
![]()
而針對行業熱議的眾包模式,覓蜂也給出了清晰的規劃:未來參考美團騎手的「培訓 + 管理」體系,在嚴格的標準規范與隱私保護機制下,推動眾包采集落地。這意味著,未來每一個普通人,都有可能成為具身智能數據的生產者,徹底打開數據產能的天花板。
比產能布局更具行業影響力的,是同步啟動的蜂巢數據共創行動。
這項由覓蜂聯合上電科、國家數據標委會、工信部賽迪研究院共同發起的行業行動,吸引了數十家海內外機構成為首批響應單位,核心目標直指行業三大痛點:打破數據孤島、統一數據標準、鏈接全球供需。
蜂巢行動設計了五大核心落地動作:
![]()
1、共享資源,接入全球供需網絡、共享海量訂單;
2、共建標準,牽頭建立行業統一的數據標準與規范;
3、生態合作,優先與成員伙伴共建軟硬件與數據生態;
4、行業發聲,聯合發布行業白皮書與技術報告;
5、產業推動,共享技術、資本、市場資源,共同推動產業規模化爆發。
它的本質,是把行業內分散的采集產能、場景資源、技術能力整合起來,形成一個開放、高效、標準化的物理 AI 數據流通網絡。
姚卯青用一個很直白的類比解釋了它的定位:覓蜂就像「滴滴」,既有自營車隊,也有大量三方運力,核心是搭建供需兩端的橋梁,讓供給方的資源高效變現,讓需求方快速拿到高質量數據。
![]()
而針對行業最關心的「覓蜂與智元的關系」問題,姚卯青也給出了明確答案:二者完全市場化解耦,智元與其他客戶一樣,需要通過市場化采購的方式才能從覓蜂獲取數據,不存在任何特殊權限。
這一設計,從根本上保障了覓蜂作為第三方數據平臺的獨立性,哪怕是與智元處于競爭關系的機器人廠商,也可以放心合作。
![]()
路線之爭終局落定:具身智能的未來,到底需要什么樣的數據?
MEgo 的發布,也把行業長期爭論的核心問題推到了臺前:真機采集、無本體采集、仿真數據,到底哪條路線才是具身智能的終局?
![]()
在發布會的圓桌論壇上,來自數據平臺、模型廠商、仿真企業、科研機構的行業大咖,給出了一致的答案:三者絕非對立替代關系,而是互補共生關系,共同構成了具身智能的數據金字塔。
![]()
在這個金字塔中,塔尖是真機采集數據。它的質量最高、針對性最強,是具身智能落地真實場景的剛需。
要讓機器人在工業產線、家庭場景中實現 100% 的任務成功率,必須依賴與落地機器人同構、同場景的數據,保障數據分布與真機運行完全匹配,這是無本體與仿真數據無法替代的。
![]()
金字塔的中間層,是本次發布會引爆的無本體采集數據。
它的核心優勢是采集效率高、場景覆蓋廣、成本低,采集效率是真機的 2-3 倍,未來成本僅為真機的 1/3。它最核心的價值,是為模型預訓練、表征學習、世界模型訓練提供海量、多樣化的基礎數據,解決行業基礎數據供給不足的核心痛點,讓模型先學會人類操作的通用邏輯與物理世界的基本規律。
![]()
而金字塔的底座,是仿真數據。
它的核心價值是數據增廣、反事實場景構建與模型規模化評測。但姚卯青也直言,仿真數據有天然的局限:仿真場景中的資產建模,需要建模師純手工打造,一個杯子的建模成本甚至比真實杯子還高,真實世界里的海量物體與場景,根本無法通過仿真完全覆蓋;
同時,仿真數據永遠無法 1:1 復刻真實世界的物理規律與隨機變量,只能作為真實數據的補充,無法成為主流。
這場路線之爭的背后,是整個行業對具身智能發展階段的清晰認知。業內已經形成共識:2026 年是具身智能數據元年,當前的具身智能,仍處于大語言模型當年的Bert時代,距離GPT級的智能涌現,仍需要 3-4 年的時間。而決定這個時間能否提前的核心變量,就是數據供給的規模化、標準化進程。
![]()
姚卯青在發布會上給出了明確預判:2026 年底,全產業有效數據量級將突破千萬小時;到 2030 年,行業需要百億小時級的高質量數據,才能真正迎來具身智能的「GPT-3 時刻」,實現通用能力的涌現。而這個過程中,行業的核心競爭,將從「本體軍備競賽」,全面轉向「數據軍備競賽」。
這也解釋了,為什么智元要分拆覓蜂,全力布局數據基建賽道。當整個行業都在扎堆卷機器人本體、卷算法的時候,智元已經看清了終局:具身智能的天花板,從來不是本體的靈巧度,而是數據的供給能力。
![]()
就像大語言模型時代,最終最先穩定盈利的,是英偉達這樣賣鏟子的算力基建廠商;具身智能時代,最先實現商業閉環、掌握行業話語權的,一定是數據基建的服務商。
![]()
具身智能的基建革命,元年的第一聲槍響
這場發布會,最值得關注的,從來不是一款新硬件,而是整個具身智能行業的底層邏輯變了。
之前所有人都在卷「機器人本體有多厲害」,但沒人解決「機器人怎么學會干活」的底層問題 ——沒有海量、高質量、全場景的數據,再靈巧的本體,也只是個沒有靈魂的鐵殼子。
覓蜂 MEgo的出現,不是給這個賽道添了一個新玩家,而是給整個行業修了一條高速公路。
它徹底打破了機器人本體對數據采集的枷鎖,讓數據采集從實驗室的固定工位,走向了真實世界的每一個角落;
它用標準化的平臺與生態,終結了行業的數據孤島亂象;它讓「高質量數據像水電一樣即取即用」,從一句口號,變成了觸手可及的現實。
2026 年被稱為具身智能數據元年,而這場發布會,就是元年的第一聲槍響。當數據荒漠迎來甘霖,困在實驗室里的具身智能,終于要走進真實的人間煙火了。
![]()
![]()
前沿動態前沿大會
前沿人物
點「在看」,給前前加雞腿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.