網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

小米發(fā)布并開源自動(dòng)駕駛視覺語(yǔ)言框架OneVL

2026-05-14 22:31:05　來(lái)源: 牛馬科技

陜西舉報(bào)

分享至

關(guān)注、點(diǎn)贊、轉(zhuǎn)發(fā)！更多科技資訊，持續(xù)為你帶來(lái)！

中國(guó)科技企業(yè)小米公司正式發(fā)布并開源其最新研發(fā)的Xiaomi OneVL框架。該系統(tǒng)旨在提升自動(dòng)駕駛模型對(duì)道路場(chǎng)景的理解、推理與預(yù)測(cè)能力。

行業(yè)首個(gè)多技術(shù)融合框架

據(jù)小米官方介紹，Xiaomi OneVL是行業(yè)內(nèi)首個(gè)將多項(xiàng)核心技術(shù)整合至單一系統(tǒng)的框架。這些技術(shù)包括視覺-語(yǔ)言-行動(dòng)模型、世界模型以及潛在空間推理。小米表示，該框架建立在XLA模型的推理能力基礎(chǔ)之上，同時(shí)顯著提升了推理速度與準(zhǔn)確率。

在自動(dòng)駕駛研究領(lǐng)域，視覺-語(yǔ)言-行動(dòng)模型與世界模型通常被視為兩種獨(dú)立的處理方式。前者主要專注于理解交通場(chǎng)景并生成駕駛動(dòng)作，后者則用于預(yù)測(cè)場(chǎng)景的演變趨勢(shì)。小米稱，OneVL是首個(gè)通過(guò)潛在空間推理將兩種方法統(tǒng)一起來(lái)的框架。

性能表現(xiàn)與技術(shù)創(chuàng)新

小米方面聲稱，該框架在多個(gè)主流感知、推理與規(guī)劃基準(zhǔn)測(cè)試中均展現(xiàn)出強(qiáng)勁性能。OneVL進(jìn)一步拓展了潛在推理方法的邊界，在保持與僅預(yù)測(cè)最終答案的潛在空間思維鏈系統(tǒng)相近速度的同時(shí)，實(shí)現(xiàn)了比顯式思維鏈推理更高的準(zhǔn)確率。

該框架的另一大技術(shù)亮點(diǎn)在于可解釋性。小米表示，OneVL能夠通過(guò)語(yǔ)言和視覺兩種形式解釋其決策過(guò)程。在實(shí)際應(yīng)用中，這意味著系統(tǒng)不僅可以描述車輛應(yīng)采取特定駕駛動(dòng)作的原因，還能同步展示對(duì)道路后續(xù)可能情況的預(yù)測(cè)結(jié)果。

戰(zhàn)略布局與行業(yè)影響

此次發(fā)布距離小米開源其音頻生成模型Omnivoice僅相隔不久。通過(guò)開源OneVL，小米正進(jìn)一步加大在人工智能與智能出行領(lǐng)域的布局力度，該領(lǐng)域已成為全球主要科技企業(yè)之間競(jìng)爭(zhēng)日益激烈的賽道。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.