黃仁勛這次的話說得挺滿:"汽車開始具備自主推理能力,不再只是單純行駛。"這話從別人嘴里出來可能就是個比喻,但英偉達剛發布的Alpamayo 2 Super,確實在嘗試把"思考"這個能力塞進自動駕駛系統里。
6月1日,英偉達正式推出了Alpamayo 2 Super。這是一款擁有320億參數的視覺-語言-動作模型——業內通常叫VLA模型。它的定位很明確:一個開源的、"教師"級別的基礎模型,專門用來訓練更小的車載模型。簡單說,它不是直接跑在車上的那個,而是負責把知識蒸餾出來、喂給輕量化版本的那個"老師傅"。
![]()
但這次升級不只是一個模型。英偉達同時發布了一套完整工具鏈:AlpaGym負責閉環強化學習訓練,OmniDreams能生成逼真的長尾駕駛場景,還有基于Omniverse NuRec的神經重建能力,可以從真實車隊視頻里批量制造合成數據。打通的是從數據采集、仿真訓練到實車部署的全流程。
Alpamayo 2 Super跟前代比,參數規模從100億直接拉到320億,翻了3倍。但數字漲了不是最關鍵的。關鍵是能力邊界拓寬了:以前只負責生成軌跡,現在覆蓋推理、規劃和執行整個鏈條。它支持邏輯推理、自動標注、場景理解、模型評估,還能把大模型知識蒸餾到輕量化版本里。目標是L4級自動駕駛——那種不需要人類隨時接管的水平。
技術上幾個升級值得拆開看。第一是全車環視。傳統方案大多靠前置攝像頭感知前方,Alpamayo 2 Super換成360度全景環境感知,覆蓋前、側、后方視野,變道、并線、路口通行這些操作有了完整環境信息。第二是新增"元動作輸出"——不再只是預測下一幀方向盤轉多少度,而是能做出"禮讓"、"變道"、"停車"這類高層級駕駛決策預判,附帶因果鏈溯源,解釋為什么做這個決策。
第三個升級直接關系到開發效率:推理式自動標注。自動駕駛數據標注一直是個燒錢燒時間的活,傳統方式動輒幾個月。Alpamayo 2 Super搭載了結合二維目標定位的推理式自動標注功能,號稱能把標注周期從數月壓縮到數日。這意味著數據鏈路的成本和效率被大幅優化。
黃仁勛的表態里還提了一點:可解釋性。他說這套系統"讓車輛識別極端場景、解釋決策邏輯、建立安全信任"。這對應的是合規監管需求——L4上車,監管部門不可能接受一個"反正模型說該這么走"的黑箱。你得說清楚為什么剎車、為什么變道。Alpamayo 2 Super的因果鏈溯源能力,就是在解決這個問題:模仿學習在長尾場景下容易出錯,現在模型能追溯決策依據。
訓練框架上也有變化。傳統開環訓練只看歷史錄制數據,模型輸出一次動作就結束了。AlpaGym提供的是閉環強化學習平臺:模型在仿真環境里持續循環"決策-感知",每次制動、轉向都會實時改變仿真環境。這意味著靜態數據集發現不了的累積誤差和極端場景故障,會被逼出來,模型在實戰模擬里持續學習。英偉達還在GitHub上開源了因果鏈自動標注流程,基于原始行車視頻全自動生成帶決策依據的標注數據,不需要人工參與。
Alpamayo系列近期拿了臺北國際電腦展的最佳選擇獎,車載技術與智能座艙類別。下載量接近40萬次。開源平臺附帶后訓練腳本,方便開發者結合自有數據集和駕駛策略做二次適配。Alpamayo 2 Super的推理代碼預計今年夏天上線GitHub,模型權重同步發布在Hugging Face。
英偉達公布的采用名單里,包括比亞迪、吉利、極氪、小米和小馬智行。這些中國車企和自動駕駛公司已經在用或者正在基于NVIDIA Hyperion平臺開發智駕系統。從百億參數的Alpamayo 1 Nano到320億參數的Alpamayo 2 Super,整個教師模型體系完成迭代后,后來者不需要從零搭建自動駕駛核心基礎設施,可以直接繼承高水準的推理和感知能力。
說到底,這輪發布的核心邏輯是:英偉達不僅賣芯片,還在構建一個從模型到仿真工具到數據的完整開發生態。讓車企能快速搭出L4級自動駕駛系統,并且這套系統能解釋自己的行為——這對監管、對用戶信任、對規模化部署到數百萬輛車,都是硬前提。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.