在昨日舉行的NVIDIA GTC 2025大會(huì)上,理想汽車自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬正式發(fā)布了公司的下一代自動(dòng)駕駛架構(gòu)——MindVLA。這一架構(gòu)融合了空間智能、語(yǔ)言智能和行為智能,旨在將汽車從單純的運(yùn)輸工具轉(zhuǎn)變?yōu)槟軌蚶斫狻⑺伎疾⑦m應(yīng)環(huán)境的智能體。 MindVLA是理想汽車自研的視覺(jué)-語(yǔ)言-行為融合模型(VLA),它成功整合了3D空間理解、邏輯推理與行為生成能力,為自動(dòng)駕駛技術(shù)注入了新的活力。據(jù)理想汽車自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬介紹,MindVLA不僅具備強(qiáng)大的感知和決策能力,還能夠像人類一樣理解并執(zhí)行自然語(yǔ)言指令,實(shí)現(xiàn)更加智能化的駕駛體驗(yàn)。 在發(fā)布會(huì)上,賈鵬詳細(xì)闡述了MindVLA的技術(shù)亮點(diǎn)。該架構(gòu)采用三維空間編碼器與語(yǔ)言模型融合設(shè)計(jì),通過(guò)自研的混合專家(MoE)模型基座實(shí)現(xiàn)多任務(wù)處理。其3D高斯表征建模技術(shù)提升了自動(dòng)駕駛場(chǎng)景建模效率,訓(xùn)練速度較傳統(tǒng)方法加快7倍。同時(shí),MindVLA還利用擴(kuò)散模型(Diffusion)生成駕駛軌跡,結(jié)合常微分方程采樣器實(shí)現(xiàn)高質(zhì)量軌跡的快速生成。 除了技術(shù)上的創(chuàng)新,MindVLA還為用戶帶來(lái)了前所未有的智能駕駛體驗(yàn)。它“聽得懂”用戶的語(yǔ)音指令,能夠?qū)崟r(shí)調(diào)整車輛路線和行為;它“看得見(jiàn)”非標(biāo)準(zhǔn)化交通標(biāo)志和復(fù)雜環(huán)境,確保駕駛安全;它“找得到”目的地和車位,即使在沒(méi)有導(dǎo)航信息的情況下也能自主漫游尋找。 為了驗(yàn)證MindVLA的實(shí)際效果,理想汽車還分享了實(shí)車自動(dòng)駕駛實(shí)測(cè)視頻。視頻中,搭載MindVLA架構(gòu)的理想汽車能夠準(zhǔn)確理解并執(zhí)行駕駛員的語(yǔ)音指令,如尋找星巴克門店、調(diào)整行駛速度、自動(dòng)泊車等。這些場(chǎng)景充分展示了MindVLA如何讓車輛像人類一樣理解物理世界,實(shí)現(xiàn)更加智能化的駕駛。 據(jù)悉,MindVLA已完成工程化適配,計(jì)劃于2026年搭載于量產(chǎn)車型中。這一消息無(wú)疑讓廣大消費(fèi)者對(duì)未來(lái)智能駕駛充滿了期待。同時(shí),理想汽車還表示,該架構(gòu)未來(lái)或拓展至室內(nèi)環(huán)境等非駕駛場(chǎng)景,探索物理與數(shù)字世界結(jié)合的通用人工智能路徑。 賈鵬在發(fā)布會(huì)上表示:“MindVLA是理想汽車在智能駕駛領(lǐng)域的重要突破,它將為汽車賦予類似人類的認(rèn)知和適應(yīng)能力,將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w。我們相信,MindVLA的發(fā)布將引領(lǐng)智能駕駛新紀(jì)元,為用戶帶來(lái)更加智能、便捷的出行體驗(yàn)。” 核心特性 3D高斯建模:通過(guò)多尺度幾何表達(dá)與自監(jiān)督學(xué)習(xí),實(shí)現(xiàn)復(fù)雜環(huán)境的實(shí)時(shí)解析,提升下游任務(wù)性能超30%。 MoE架構(gòu)+稀疏注意力:采用混合專家架構(gòu)與稀疏注意力技術(shù),保持毫秒級(jí)推理速度的同時(shí),模型規(guī)模增長(zhǎng)。 人類式思考:引入“快思考”與“慢思考”雙模式,車輛能在常規(guī)場(chǎng)景中快速響應(yīng),在復(fù)雜博弈中深度分析。 擴(kuò)散模型優(yōu)化:基于擴(kuò)散模型與ODE采樣器,僅需2-3步即可生成高精度軌跡,優(yōu)化安全底線。 云端世界模型:自研“重建+生成”云端模型,通過(guò)3D高斯技術(shù)將場(chǎng)景重建速度提升7倍,支持大規(guī)模閉環(huán)強(qiáng)化學(xué)習(xí)。 跨領(lǐng)域泛化:模型在訓(xùn)練中融入多模態(tài)數(shù)據(jù),展現(xiàn)出室內(nèi)導(dǎo)航、物流調(diào)度等跨場(chǎng)景潛力。 行業(yè)影響 理想汽車CEO李想表示:“MindVLA將像iPhone 4重新定義手機(jī)一樣,顛覆自動(dòng)駕駛。”這一技術(shù)的發(fā)布不僅對(duì)汽車行業(yè)產(chǎn)生深遠(yuǎn)影響,還將為物流、安防等領(lǐng)域帶來(lái)新的發(fā)展機(jī)遇,打開萬(wàn)億級(jí)AGI市場(chǎng)。 |