嘉 賓:唐文斌 原力靈機CEO
訪 談:孫允廣 正和島內容總監
編 輯:豆汁兒
來 源:正和島(ID:zhengehdao)
新質說
● 技術信仰:從人臉識別到具身智能,跨越AI兩個時代,始終相信技術可以改變物理世界。因為相信,所以看見,也因為信仰,所以能夠抵達。
● 價值務實:不滿足于讓機器人跳舞,而是賦予它在真實世界里解決問題的能力。讓機器人擁有“大腦”,從替代人類“不想干的活”開始。
● 斜率思維:當前模型第一不重要,重要的是那一階導。保持極高的迭代效率,讓技術飛輪快速旋轉,比任何一個靜態節點的排名都更具意義。
![]()
在王者榮耀里,虞姬是個后期英雄,沒有太多復雜和花哨的操作,前期堅定發育,到了后期爆發力極強。
唐文斌很喜歡這個角色。
而現實中,唐文斌的工位和普通員工在同一個大開間,沒有獨立辦公室——很像他玩虞姬時“去繁就簡、直奔本質”的作風。
![]()
唐文斌工位
他坐在會議室里,面前放著一個印有“Dexmal X” Logo的杯子,這的確容易讓人產生聯想——馬斯克對X的迷戀,SpaceX、xAI、X平臺。
但他說這不是刻意模仿,“X代表更科技、更多可能性的東西。”
這是2026年4月的一個下午,正和島“新質企業家”欄目走進了原力靈機。
從曠視科技到原力靈機,唐文斌的創業軌跡,橫跨了中國AI產業的兩個時代。
14年前,他和印奇、楊沐創辦曠視,成為AI 1.0時代的標志性人物;14年后,他帶著一群“曠視老將”重新出發,闖入具身智能這片更復雜的戰場。
這家成立僅一年多的機器人公司,正在試圖回答一個所有人都想知道的問題:
當大模型撞上物理世界,具身智能的“ChatGPT時刻”,還有多遠?
![]()
原力靈機
01 用眼睛看世界
2026年的中國機器人賽道,熱浪翻涌,群雄扎堆。
“仿生蔡明”在春晚舞臺上演小品,特斯拉的Optimus隔段時間就釋放一次新進展,馬斯克說未來人形機器人的數量會超過人類。
各大車企、互聯網巨頭、創業公司紛紛入局,投資人拿著錢找項目,獵頭瘋狂挖人。
而在前幾天舉辦的2026北京亦莊半程馬拉松上,人形機器人與人類跑者同場競技,再次將“機器人何時真正融入現實世界”的討論推向高潮。
據不完全統計,2025年中國機器人領域融資事件超過600起,總金額超過500億元。
在這波熱浪中,原力靈機無疑是資本最追逐的標的之一。
成立不到一年,三輪融資累計近12億元——2025年3月天使輪2億元,A輪蔚來資本領投,A+輪阿里巴巴獨家注資數億元。
但唐文斌對這股熱潮出奇冷靜:“今天大家的水平其實都挺差的。”
時間倒回2011年,唐文斌和清華同學印奇、楊沐一起創辦曠視科技。那時深度學習還是個學術圈的小眾話題,人臉識別的準確率慘不忍睹。
他們從一款手機體感游戲起步,誤打誤撞殺進了金融級身份認證領域,成了支付寶刷臉支付背后的技術供應商。
“我們其實先做的是偏技術的東西,然后想這個技術哪里用。”唐文斌回憶,當時iPhone 4剛出前置攝像頭,他們覺得可以把Kinect那種體感交互搬到手機上,于是做了一款人臉追蹤小游戲。
游戲火了,創業的念頭也從此落地。
公司取名“曠視”——曠,就是大的視覺。
“我們認為未來一定會有很多機器人,機器人就像人一樣需要眼睛。人的信息輸入百分之九十幾都靠眼睛,所以我們覺得眼睛是走向機器人的第一步。”
從人臉識別到物流機器人,曠視的機器人夢一直在水面下流淌。
2018年,他們正式切入物流場景,給倉庫做自動化方案。
最出名的一仗是優衣庫上海倉庫——超過1000臺不同類型機器人協同作業,單體項目接近3億元,是當年國內物流自動化領域最大的一單。
但也是一場“噩夢”。
唐文斌回憶,投標過程像“超女選秀”,所有供應商被一輪輪篩選,大家互相“左腳踩右腳上天”,不斷over promise。
拿下來之后才發現,實際能力只達到目標的百分之三四十,項目瀕臨失敗。
于是他帶著團隊在倉庫里蹲了三個月。推倒代碼重來,主動承擔賠償,向客戶要了半年時間。
項目最后跑通了,效率遠超優衣庫其他自動化倉庫。因為這個項目,他被邀請去日本見了迅銷集團社長柳井正。
在倉庫里與物理世界貼身肉搏的經歷,讓他比很多人都更早地看清,軟件算法與硬件落地之間,存在著巨大鴻溝。
02 從“看懂世界”到“改變世界”
2025年,唐文斌拉上曠視時期的核心團隊成員,創辦了原力靈機(Dexmal)。
方向很明確:做機器人的“大腦”。
![]()
從“曠視”到“原力靈機”,從“大的視覺”到“原生的靈巧”,如果說曠視時代是讓機器“看懂世界”,那么原力靈機則想讓機器“改變世界”。
而這個改變的前提,是為機器造一個真正能思考、會判斷的“大腦”。
為什么大腦如此重要?
“你看今天的機器人,運動控制已經做得很好了,跳舞跳得比人都帥。但它沒有在操作這個世界,沒有在改變這個世界。”唐文斌一語道破。
機器人行業內一個心照不宣的共識是,硬件本體的進化速度遠快于智能水平的進化。
即便是以運動控制聞名的宇樹科技,也在IPO時明確表示,募資的近一半的資金——約20.22億元,就是要用來攻克機器人的“大腦”問題。
“你讓它去炒個菜,成功率能有多少?切個水果呢?”在唐文斌看來,現在機器人“智商的缺失”,使得它面對真實世界的復雜任務時,幾乎寸步難行。
硬件已經備好,但缺少一個能指揮它的“司令部”。
這個“大腦”到底難在哪兒?他一一列出。
首先,模型本身該長什么樣,架構怎么設計,業界還沒形成共識。
其次,給機器人“喂”什么數據去學習,是純機器人數據還是加上人類數據,也沒定論。
再者,訓練方法是什么,流程怎么搭,沒人清楚。
并且,即使有了一個六七十分的模型,怎么讓它在干活兒的過程中自己發現錯誤、收集數據,再通過一個“數據飛輪”越轉越快,變成八九十分?
這條鏈條上的每一環,現在都是問題。
此前在曠視做計算機視覺(CV),面對的是一個相對確定的數字游戲,評測指標清晰,數據集固定。
但機器人是一個與物理世界充分交互的閉環系統。“任務沒成功,天知道中間發生了什么。”原力靈機聯合創始人范浩強感慨。
所以唐文斌的思考并沒有停留在做模型這一層,他有很務實的商業推演邏輯,然后給團隊定了一個選擇應用場景的標準:
第一,錯誤容忍度高的場景。現在做不到百分百成功,場景本身要有兜底機制;
第二,節拍容忍度高。不能要求機器人像自動化設備一樣精準卡點,要允許它節奏有快慢;
第三,泛化性的作業需求。任務不能太單一,否則非標自動化就能解決,用不上通用機器人;
第四,長時間作業。讓機器人持續工作,才能把價值卷出來,覆蓋掉成本。
按照這個標準反推,他認為家庭場景現在還不成熟。
“你買個人形機器人回家,挺貴的,能干的活還很少。而且用戶的容忍度極低,1%的概率把碗摔了,你收拾都不知道誰去收拾。”
相比之下,倉儲物流、工業制造等B端場景,才是現階段驗證技術、積累數據、打磨迭代能力的真實場景。
“需求就在那里”他說,“阿姨干的活能不能讓機器人干,大街上掃地能不能讓機器人好好掃,我們不是在創造需求,我們是在創造解決方案。
而創造解決方案的第一步,是先回答一個更底層的問題:這個“大腦”,到底該怎么造?
03 第一不重要,重要的是“迭代的斜率”
2026年2月,原力靈機發布了第一個具身原生大模型DM0(DexModel 0)。
在真實機器人操作的開源評測平臺RoboChallenge上,DM0的成績拿下雙項世界第一。
但唐文斌認為“這個第一也沒那么重要”。
他關心的不是當前這個點的數值f(x),而是曲線的導數。
他把公司內部的文化總結為兩個詞:技術信仰,價值務實。
而支撐這兩個詞落地的,是他篤信的一個更本質的競爭力——迭代的效率。
“我們要的不是今天f(x)的值,我們要的是那個一階導。”唐文斌說,創業公司和大廠競爭,拼的不是存量,是誰迭代得更快。
“idea是廉價的。大家都很聰明,你知道的東西,三個月后別人也知道了。別人知道的東西,我們大概三個月后也知道了。所以真正重要的是迭代的斜率。”
為了保持這個高斜率,技術路線的選擇就變得至關重要。
現在業內做VLA(視覺-語言-動作)模型的主流做法,是在一個現成的多模態大模型(VLM)上“嫁接”一個動作模塊。
這個VLM,通常是用海量互聯網圖文視頻數據訓練出來的開源模型。
唐文斌打了個比方:這就像一個九年制義務教育的初中生,剛上完初中就被拉去體校狂練體育。
后果有兩個:一是“根骨不扎實”,因為它從沒見過物理世界的數據,相當于“沒有從小練體育”,體能上限不高。
二是“光練體育不練文化課”,原來在互聯網數據上積累的理解能力,在專攻體育三年后,也退化得差不多了。
原力靈機的思路截然不同。
他們要搞“原生”訓練:從模型訓練的第一天起,就讓它同時接觸互聯網多模態數據和物理世界數據——視頻、機器人操作數據、導航數據、力觸覺數據——并且把“理解世界、操作世界、預測世界”三個目標聯合訓練。
“我們希望打造一個德智體美勞更全面發展的模型。”
這其中有一個更深層的技術分野:為什么不直接買一個現成的“世界模型”,然后在上面訓練機器人?這聽起來更直接。
唐文斌的解釋是,邏輯不對。
“世界模型比機器人的操作模型要復雜得多。如果說我們都能夠非常好地去模擬這個世界,那它里面幾乎已經蘊含了世界的所有知識。你想,先解決一個更難的問題,然后你就能解決那個簡單的問題了?”
也就是說,這相當于為了教機器人擰螺絲,先去把整個工廠的物理法則都復刻一遍,代價太大,也不現實。
原力靈機的做法很巧妙:他們也有一個世界模型,但它不是被當作一個完美的“模擬器”來直接驅動決策,而是在訓練過程中,被當成一個“陪練”和“強化監督信號”。
簡單說,就是在訓練機器人操作能力時,讓它在那個“雖不完美但夠用”的世界模型里先“演練”一遍,用這個虛擬結果作為反饋,持續修正操作模型。
但在機器人真正干活時,并不需要一邊預測世界一邊行動,只需要跑那一小部分執行模塊,干脆利落。
這套技術路線,沒有追逐“世界模型”的風口,而是基于他們對問題本質的判斷:先讓機器人能干活,同時在訓練中引入對世界的理解作為輔助。
![]()
圖源:原力靈機
團隊將這個過程戲稱為“煉丹”。
這個詞不是現在才有的,早在2012、2013年在曠視訓練深度學習模型時,大家就開始說了。
“你不知道最后燉出來是什么效果,東西先丟進去,但煉丹也是個手藝活。”
十幾年過去,這個詞從一個內部玩笑變成了技術人的自嘲。
原力靈機的代碼庫里,有一個項目名字就叫“鐵鍋燉”,聯合創始人汪天才他們起的。
唐文斌第一次看到TGD這個縮寫時問是什么意思,答曰:鐵鍋燉。他覺得挺逗,就保留了。
而這種扁平化、略帶極客幽默感的氛圍,是唐文斌刻意維持的。
04 務實的理想主義者
在金隅智造工場的兩層樓里,唐文斌沒有獨立辦公室,工位和普通員工在一起。
聯合創始人也是同樣待遇,散落在團隊中間,像沒有特殊標記的NPC。
如果你想找他們,直接走過去就好。
整個辦公區通透而簡單,一如他們的溝通方式。
而如果仔細看會議室的標牌,會發現它們各有來頭:
Flow來自《心靈奇旅》,Matrix是《黑客帝國》,Red Queen是《愛麗絲夢游仙境》里那個叫嚷著“砍掉他們的腦袋”的紅桃皇后,Jarvis是鋼鐵俠的AI管家。
![]()
原力靈機辦公區
在經歷了行業起伏、從巔峰到低谷的完整周期后,再次出發的唐文斌和他身邊的“新三劍客”——范浩強、周而進、汪天才——選擇了一條更安靜、也更tough的路。
核心團隊頗為年輕:唐文斌1987年出生,范浩強1994年,周而進1992年,汪天才1994年。汪天才的名字的確名副其實——他曾在某一年入選過全球前2%科學家榜單。
這四個人都是曠視的老員工,一起經歷過從計算機視覺到具身智能的范式轉移。他們為什么愿意再次聚到唐文斌身邊?
聯合創始人范浩強最直觀的感受是“太拼了”。他說唐文斌可能是公司里工作時長最長的人,沒有之一。
“各個大大小小、內內外外的事情都能一把挑起來,并且哪怕非常忙,依然在做每件事的時候還能傾注百分百的熱情。”
他覺得,是唐文斌對機器人這件事心里有足夠強的信念,所以才能驅動自己像個“鐵人”一樣。
周而進用的詞是“真誠且務實”。共事多年,他認為唐文斌的風格是實事求是,事情是怎樣就怎樣,該怎么解決就怎么解決。
“大家也不是第一次創業,都知道創業過程中要經歷哪些坎,哪些東西該扎實完成,哪些東西該給客戶創造價值。文斌在這些事情上非常務實。”
汪天才則認為唐文斌是“開放且務實”的。他解釋說,開放在于“什么都可以聊”,員工的意見和看法都能直接提,唐文斌會從不同視角去吸收和討論。
而務實的一體兩面則體現在賽道選擇上,“不是一個純講故事的心態。投資人想聽什么就講什么,他不搞花里胡哨那一套。”
這群人聚在一起的底層原因,范浩強用了一個詞總結:信仰。
在采訪中,團隊反復提到這個詞。
“2020年,那個時候講端到端是很困難的,不管是研發層面還是讓別人相信。我們被拒絕了很多次,paper被拒,方案被質疑。但你內心不信,你是無法堅持的。”
汪天才把這種邏輯遷移到了機器人上:“從數字世界到物理世界,從開環走向閉環。自駕并不會直接改變物理世界,除非發生車禍。但具身智能時時刻刻都在與物理世界交互,導航也好,操作也好,閉環程度遠超自駕。”
范浩強把團隊的凝聚力,歸為一個很純粹的理由:“一群有情有義的人,去干一件有意義的事情。”
他說,強的同學都更喜歡跟強的同學合作,而具身智能這件事本身就足夠有挑戰性,也足夠讓人興奮。
一個人能讓一群比他只年輕幾歲的天才心甘情愿地跟隨,沒有靠職位、畫餅,靠的是他們說的這些——拼、真誠、開放。還有最重要的:他自己的信念。
唐文斌給自己的定義是:一個務實的理想主義者。
“我自己是個比較簡單的人,不太能講很多我不信的話,”他說,“團隊內部也崇尚一種簡單直接的溝通文化,這其實是一幫技術同學想要追求的環境。”
05 100萬臺機器人
打開原力靈機官網,很顯眼的一行字跳了出來:Build Intelligent, Useful, and Trustworthy Robots for A Better Life(打造智能的、有用的、可信賴的機器人,讓生活更美好)。
三個形容詞,對應三個維度:智能,是大腦能力;有用,是生產力價值;可信賴,是安全性和可靠性。
對于未來,唐文斌的目標明確:十年內,至少打造一個縣城級別的生產能力。
他的老家在浙江新昌,40萬人口。“假設三個機器人能產生一個人的生產力,我們希望至少打造100萬臺機器人在持續被使用的狀態。”
他特意強調,“不是賣出去100萬臺,是100萬臺真正在被使用。”
賣出去和用起來,就像demo和產品,是兩回事。
唐文斌了解這之間的距離。
他經歷過曠視從實驗室到產業的完整周期,知道一個技術從“能work”到“能用”再到“好用”之間,存在很多次推倒重來。
公司名字Dexmal,Dex來自Dexterity(靈巧),mal來自Animal(生物),他希望機器人能像生物一樣靈巧和多形態。
會議室Baymax的名字,取自電影《超能陸戰隊》里的大白——一個充氣機器人,笨拙、柔軟、可靠、溫暖。
電影主題曲里有句歌詞:我將忠誠守護,你那熾熱的夢想。
![]()
Baymax會議室
這大概就是這群人想做的東西:
打造智能的、有用的、可信賴的機器人,讓它們真正關心人類的生活,解決那些繁瑣的、危險的、人類不想做的事情。
讓人類進入一個生產力極大富足的時代,去探索更廣闊的星辰大海。
當被問到機器人融入現實世界,是否預示著終結者時代的來臨時,唐文斌笑了:有可能。
然后他補充說:“整個技術發展的斜率越來越陡。我們身處局中,但它的發展依然超出我們的預期。這是一個非常令人興奮的時代,我們很感謝能生在這樣一個時代。”
窗外,北京的春天正在發生。會議室Red Queen隔壁,程序員們對著屏幕敲代碼。
DM0的下一個版本即將發布,評測榜單上的排名會被再次刷新。
![]()
原力靈機辦公區
唐文斌的工位銘牌,名字下邊只有一行字:twb@dexmal.com。
沒有title,沒有成就。
和他在公司里的工位一樣,不需要任何額外的標注。
Flow——一個會議室的名字,也是一個概念:流動,變化,持續向前。
這大概就是他們相信的東西。
不是你現在在哪里,而是你在向哪里流動,以及,有多快。
原力靈機北京的金隅智造工場外,幾個背著雙肩包的年輕工程師,騎著自行車,呼嘯而過。
也許在未來的某一天,這條路上會有一個機器人正在清掃街道,或是駕駛著一輛貨車駛過……
那時的它,會如何看待眼前的世界?
是計算路面的摩擦力,評估風阻對能耗的影響,還是像人類一樣感受一陣風穿過樹葉的輕柔?
陽光之下,是真實、復雜、亟待被新技術改變的物理世界。
而屋內這群人正在做的,或許可以被看作是一種漫長而耐心的翻譯工作——將人類關于智慧與行動的朦朧想象,翻譯成一行行能被機器讀取并執行的代碼。
他們不知道自己最終會翻譯出什么。
就像當年的“煉丹”,東西丟進去,不知出來的是什么,但有人愿意一直守在爐子旁邊。
也沒有人知道,當這些代碼最終蘇醒,理解杯子不只是像素和力矩的組合,而是某種可以被遞出的善意時——它會如何描述這個春天?
或許它什么都不會說。
只是安靜地,把一杯水端穩。
(綠島鄰事業部北京區域經理趙珊珊對此文亦有貢獻)
排版| 木棉
審校| 豆汁兒主編| 孫允廣
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.