關(guān)注、點(diǎn)贊、轉(zhuǎn)發(fā)!更多科技資訊,持續(xù)為你帶來(lái)!
中國(guó)科技企業(yè)小米公司正式發(fā)布并開源其最新研發(fā)的Xiaomi OneVL框架。該系統(tǒng)旨在提升自動(dòng)駕駛模型對(duì)道路場(chǎng)景的理解、推理與預(yù)測(cè)能力。
行業(yè)首個(gè)多技術(shù)融合框架
據(jù)小米官方介紹,Xiaomi OneVL是行業(yè)內(nèi)首個(gè)將多項(xiàng)核心技術(shù)整合至單一系統(tǒng)的框架。這些技術(shù)包括視覺-語(yǔ)言-行動(dòng)模型、世界模型以及潛在空間推理。小米表示,該框架建立在XLA模型的推理能力基礎(chǔ)之上,同時(shí)顯著提升了推理速度與準(zhǔn)確率。
在自動(dòng)駕駛研究領(lǐng)域,視覺-語(yǔ)言-行動(dòng)模型與世界模型通常被視為兩種獨(dú)立的處理方式。前者主要專注于理解交通場(chǎng)景并生成駕駛動(dòng)作,后者則用于預(yù)測(cè)場(chǎng)景的演變趨勢(shì)。小米稱,OneVL是首個(gè)通過(guò)潛在空間推理將兩種方法統(tǒng)一起來(lái)的框架。
性能表現(xiàn)與技術(shù)創(chuàng)新
小米方面聲稱,該框架在多個(gè)主流感知、推理與規(guī)劃基準(zhǔn)測(cè)試中均展現(xiàn)出強(qiáng)勁性能。OneVL進(jìn)一步拓展了潛在推理方法的邊界,在保持與僅預(yù)測(cè)最終答案的潛在空間思維鏈系統(tǒng)相近速度的同時(shí),實(shí)現(xiàn)了比顯式思維鏈推理更高的準(zhǔn)確率。
該框架的另一大技術(shù)亮點(diǎn)在于可解釋性。小米表示,OneVL能夠通過(guò)語(yǔ)言和視覺兩種形式解釋其決策過(guò)程。在實(shí)際應(yīng)用中,這意味著系統(tǒng)不僅可以描述車輛應(yīng)采取特定駕駛動(dòng)作的原因,還能同步展示對(duì)道路后續(xù)可能情況的預(yù)測(cè)結(jié)果。
戰(zhàn)略布局與行業(yè)影響
此次發(fā)布距離小米開源其音頻生成模型Omnivoice僅相隔不久。通過(guò)開源OneVL,小米正進(jìn)一步加大在人工智能與智能出行領(lǐng)域的布局力度,該領(lǐng)域已成為全球主要科技企業(yè)之間競(jìng)爭(zhēng)日益激烈的賽道。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.