文| 新熵 茯神
編輯丨思原 九黎
當(dāng)理想i8在暴雨中的山區(qū)公路上自動(dòng)識(shí)別出被沖垮的路肩,平穩(wěn)減速并規(guī)劃出繞行路線時(shí);當(dāng)小鵬P7 Ultra僅憑視覺(jué)傳感器就精準(zhǔn)避讓了橫穿馬路的流浪貓與突發(fā)變道的貨車時(shí),智能駕駛行業(yè)悄然迎來(lái)了一場(chǎng)技術(shù)革命的臨界點(diǎn)。
新能源汽車的市場(chǎng)淘汰賽已進(jìn)程過(guò)半,從電池續(xù)航、充電速度到座艙智能化,競(jìng)爭(zhēng)之下市場(chǎng)早已進(jìn)入紅海,甚至智駕能力也正從爭(zhēng)議不斷的“加分項(xiàng)”轉(zhuǎn)變?yōu)闆Q定車企生死的“生存項(xiàng)”。
今年8月,理想、小鵬、元戎啟行在兩周內(nèi)先后宣布VLA(Vision-Language-Action)大模型上車,規(guī)劃幀率從10Hz跳到20Hz,端到端時(shí)延壓進(jìn)100ms?;蛟S就在同時(shí),華為在松山湖實(shí)驗(yàn)室里正演示著,一輛搭載激光雷達(dá)的轎車在仿真機(jī)里連續(xù)“想象”未來(lái)5秒,把自己從暴雨+錐桶+逆行三輪車的死局中救了出來(lái),用的正是WA(World Action)世界模型。

圖/小紅書截圖
兩條不同的路線,卻是同樣的終局。VLA讓汽車“開(kāi)口說(shuō)話”,WA讓汽車“動(dòng)腦想象”。誰(shuí)先把“說(shuō)話”變成“思考”,誰(shuí)就在新能源淘汰賽的最后一節(jié)拿到發(fā)球權(quán)。
后端到端時(shí)代
在智能駕駛行業(yè)的早期發(fā)展階段,硬件無(wú)疑是競(jìng)爭(zhēng)的核心所在。車企們深知,要想讓車輛具備智能駕駛的能力,首先得讓車輛“看”得見(jiàn)、“聽(tīng)”得清、“反應(yīng)”得快。因此,它們?cè)趥鞲衅?、芯片等硬件上投入了大量的資金和精力。
傳感器就如同車輛的“眼睛”和“耳朵”,能夠感知周圍的環(huán)境信息。激光雷達(dá)、攝像頭、毫米波雷達(dá)等不同類型的傳感器各有優(yōu)劣,車企們需要根據(jù)自身的技術(shù)路線和成本預(yù)算進(jìn)行選擇和搭配。
芯片則是車輛的“大腦”,負(fù)責(zé)對(duì)傳感器采集到的數(shù)據(jù)進(jìn)行快速處理和決策。高性能的芯片能夠提供強(qiáng)大的計(jì)算能力,支持復(fù)雜的算法運(yùn)行,從而實(shí)現(xiàn)更高級(jí)的智能駕駛功能。英偉達(dá)、英特爾等芯片巨頭,推出的自動(dòng)駕駛芯片在算力、功耗等方面不斷取得突破,為智能駕駛的發(fā)展提供了有力的支持,自然成了車企們爭(zhēng)相合作的對(duì)象。
然而在之前的硬件競(jìng)賽邏輯里,車企們普遍認(rèn)為“傳感器數(shù)量決定感知能力”,但這種思路很快陷入了高成本與低效率的雙重困境。以激光雷達(dá)為例,2020年一顆高性能激光雷達(dá)的成本超過(guò)1萬(wàn)美元,搭載3顆激光雷達(dá)的車型僅硬件成本就增加3萬(wàn)美元,這直接導(dǎo)致早期智駕車型的售價(jià)普遍超過(guò)50萬(wàn)元,難以進(jìn)入主流市場(chǎng)。
小鵬P7早期版本因搭載兩顆激光雷達(dá),售價(jià)較同配置無(wú)激光雷達(dá)版本高出8萬(wàn)元,上市后月銷長(zhǎng)期徘徊在3000輛以下,直到推出簡(jiǎn)化激光雷達(dá)配置的版本才實(shí)現(xiàn)銷量突破。
2019年,作為端到端路線的先行者,特斯拉為智能駕駛技術(shù)的發(fā)展開(kāi)辟了一條新的道路。該路線的核心思想是通過(guò)大量實(shí)際路測(cè)數(shù)據(jù)訓(xùn)練模型,讓車輛直接從傳感器輸入到控制輸出,實(shí)現(xiàn)自動(dòng)駕駛技術(shù)的快速迭代。
特斯拉利用其龐大的車隊(duì)規(guī)模和廣泛的用戶群體,收集了海量實(shí)際路測(cè)數(shù)據(jù),這些數(shù)據(jù)涵蓋了各種不同的路況、天氣條件和駕駛場(chǎng)景。再通過(guò)對(duì)這些數(shù)據(jù)的分析和訓(xùn)練,自動(dòng)駕駛模型不斷優(yōu)化和改進(jìn),最終實(shí)現(xiàn)自動(dòng)輔助導(dǎo)航駕駛、自動(dòng)變道、自動(dòng)泊車等一系列高級(jí)功能。
國(guó)內(nèi)車企在看到端到端路線的成功之后,隨即紛紛效仿。它們加大了在數(shù)據(jù)采集和模型訓(xùn)練方面的投入,希望能夠在這場(chǎng)智能駕駛的競(jìng)賽中占據(jù)一席之地。
不過(guò),端到端路線并非完美無(wú)缺,它在處理長(zhǎng)尾場(chǎng)景時(shí)存在著明顯的局限,比如突然出現(xiàn)的行人、違規(guī)行駛的車輛、惡劣天氣下的道路狀況等。由于這些場(chǎng)景在實(shí)際路測(cè)中出現(xiàn)的頻率較低,端到端模型很難通過(guò)少量的數(shù)據(jù)進(jìn)行充分的學(xué)習(xí)和訓(xùn)練,因此在面對(duì)這些情況時(shí)往往難以做出準(zhǔn)確的判斷和決策。
VLA閃電逆襲
端到端路線的局限,為VLA路線的崛起埋下了伏筆。
2023年底,理想汽車率先提出VLA技術(shù)概念,其核心是通過(guò)整合視覺(jué)、語(yǔ)言、行動(dòng)三種模態(tài),讓智駕系統(tǒng)像人類一樣“觀察、推理、決策”。
與端到端的“數(shù)據(jù)映射”不同,VLA系統(tǒng)能夠?qū)⒁曈X(jué)感知到的信息轉(zhuǎn)化為語(yǔ)言描述,再通過(guò)語(yǔ)言模型進(jìn)行邏輯推理,最后輸出具體的行動(dòng)指令。
在智能駕駛的賽道上,“先發(fā)優(yōu)勢(shì)”曾被視為不可逾越的壁壘。華為早在2019年就推出了ADS(高階智能駕駛系統(tǒng)),憑借激光雷達(dá)+高精地圖的組合,一度成為行業(yè)技術(shù)標(biāo)桿;百度Apollo更是從2013年就開(kāi)始布局智駕,累計(jì)投入超過(guò)500億元。然而,VLA路線的出現(xiàn),讓理想、小鵬等“后發(fā)者”實(shí)現(xiàn)了閃電逆襲,徹底改寫了行業(yè)競(jìng)爭(zhēng)格局。
理想用戶在日常使用汽車的過(guò)程中,車輛會(huì)持續(xù)收集各種駕駛數(shù)據(jù),包括道路信息、交通狀況、駕駛行為等。這些數(shù)據(jù)不僅數(shù)量龐大,而且涵蓋了多種不同的場(chǎng)景和情況,為VLA模型的訓(xùn)練提供了豐富的素材。通過(guò)對(duì)這些數(shù)據(jù)的分析和挖掘,理想汽車的研發(fā)團(tuán)隊(duì)能夠深入了解用戶的需求和駕駛習(xí)慣,針對(duì)性地對(duì)VLA模型進(jìn)行優(yōu)化和改進(jìn),提高模型的準(zhǔn)確性和適應(yīng)性。
小鵬汽車則在算力方面加大投入,構(gòu)建起強(qiáng)大的云端訓(xùn)練集群,為VLA模型的高效訓(xùn)練提供了有力支持。
其研發(fā)團(tuán)隊(duì)可以利用云端訓(xùn)練集群同時(shí)運(yùn)行多個(gè)模型訓(xùn)練任務(wù),大大提高了訓(xùn)練效率。此外,云端訓(xùn)練集群還具有可擴(kuò)展性,能夠根據(jù)研發(fā)需求隨時(shí)增加計(jì)算資源和存儲(chǔ)容量,滿足VLA模型不斷迭代和優(yōu)化的需求。

當(dāng)然,并不是所有玩家都有理想、小鵬的體量。成立于2019年的元戎啟行,2024年只交付了3.4萬(wàn)輛,卻選擇“All in VLA”。其CEO周光算過(guò)一筆賬:做10萬(wàn)輛車、每車每天跑50公里、回傳率20%,一年就能攢到18億公里數(shù)據(jù),剛好跨過(guò)“冷啟動(dòng)死亡谷”。
為了搶時(shí)間,元戎把DeepRoute IO 2.0平臺(tái)開(kāi)放給五家主機(jī)廠共享數(shù)據(jù)、共享算力,換取“上車量”。今年8月26日,元戎發(fā)布VLA量產(chǎn)版本,宣稱“Orin-X+征程5”雙芯片方案就能跑通20Hz規(guī)劃幀率,把BOM成本壓到5500元人民幣,比華為MDC 810低32%。對(duì)于年銷量較低且資金不充裕的企業(yè)而言,這幾乎是唯一可選的“船票”。周光直言:“VLA讓中小車企第一次有機(jī)會(huì)用低成本復(fù)制頭部體驗(yàn),窗口期18個(gè)月,錯(cuò)過(guò)就沒(méi)了?!?/p>
WA才是終極?
與全民VLA的喧囂不同,華為、蔚來(lái)卻選擇了一條更為“激進(jìn)”的技術(shù)路線——WA(World Model,世界模型)。
WA路線的核心邏輯是,讓智駕系統(tǒng)通過(guò)云端模擬數(shù)據(jù)構(gòu)建一個(gè)“數(shù)字孿生世界”,從而實(shí)現(xiàn)對(duì)真實(shí)世界的深度理解。與VLA的“從數(shù)據(jù)到?jīng)Q策”不同,WA試圖讓系統(tǒng)“先理解世界,再作出決策”,這種思路被不少專家視為智駕的“終極答案”。
華為ADS研發(fā)負(fù)責(zé)人王軍,曾用一個(gè)生動(dòng)的比喻解釋W(xué)A的優(yōu)勢(shì):“如果把智駕系統(tǒng)比作學(xué)生,VLA是通過(guò)做海量習(xí)題來(lái)應(yīng)對(duì)考試,遇到?jīng)]見(jiàn)過(guò)的題目就會(huì)束手無(wú)策;而WA是先理解知識(shí)點(diǎn),無(wú)論遇到什么新題目,都能通過(guò)規(guī)律推導(dǎo)得出答案?!蔽祦?lái)的李斌也曾在內(nèi)部郵件中稱:“WA讓車擁有‘想象力’,而不是‘記憶力’?!?/p>
從理論上看,WA系統(tǒng)能夠從根本上解決VLA系統(tǒng)對(duì)數(shù)據(jù)的依賴,尤其是在處理長(zhǎng)尾場(chǎng)景時(shí),具備更強(qiáng)的通用性和適應(yīng)性。
不過(guò),這些優(yōu)勢(shì)目前還是基于理論,想要實(shí)現(xiàn)商業(yè)化落地,WA路線仍需突破資金、數(shù)據(jù)、模擬與現(xiàn)實(shí)平衡的三重考驗(yàn),也使其暫時(shí)成為了“巨頭專屬”。
構(gòu)建數(shù)字孿生世界,涵蓋硬件設(shè)備、軟件研發(fā)、場(chǎng)景建模等多個(gè)領(lǐng)域。華為在WA路線上的投入已超過(guò)200億元,其中僅數(shù)字孿生平臺(tái)的服務(wù)器集群就耗資50億元,每年的電力和維護(hù)成本高達(dá)8億元;蔚來(lái)為了研發(fā)WA系統(tǒng),專門成立了 “世界模型實(shí)驗(yàn)室”,截至2024年,累計(jì)投入超過(guò)150億元,占其總研發(fā)費(fèi)用的40%。

圖/華為
這種級(jí)別的資金投入,將絕大多數(shù)中小車企拒之門外。某新勢(shì)力車企創(chuàng)始人曾坦言:“我們不是不想做WA,而是做不起。僅構(gòu)建基礎(chǔ)的數(shù)字孿生場(chǎng)景,就需要至少50億元,這相當(dāng)于我們3年的研發(fā)預(yù)算,根本無(wú)法承擔(dān)?!毕啾戎?,VLA路線的研發(fā)投入僅為WA的十分之一,更適合資金有限的企業(yè)。
VLA讓汽車先學(xué)會(huì)“說(shuō)話”,WA讓汽車再學(xué)會(huì)“想象”。前者或許是眼下的賽點(diǎn),后者則可能是三年之后的終點(diǎn)。對(duì)于理想、小鵬,VLA是逆襲的通行證;對(duì)于華為、蔚來(lái)來(lái)說(shuō),WA是護(hù)城河的奠基石。而更多年銷量不過(guò)十萬(wàn)輛的品牌,只能在窗口期里拼命擠上船,哪怕船票是成為“代工廠”。
智駕領(lǐng)域的“終場(chǎng)哨”尚未吹響,真正的終局,屬于那些能把“說(shuō)話”和“想象”融合成“思考”的玩家。在這場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)中,只有那些既能把握當(dāng)下市場(chǎng)需求,又能洞察未來(lái)技術(shù)趨勢(shì)的企業(yè),才能在新能源汽車的淘汰賽中笑到最后。
參考資料:經(jīng)濟(jì)觀察報(bào),《理想的VLA“長(zhǎng)征”》虎嗅,《新一輪智駕PK,邁入實(shí)戰(zhàn)時(shí)刻》遠(yuǎn)川汽車評(píng)論,《讓一部分輔助駕駛先學(xué)會(huì)思考》42號(hào)車庫(kù),《元戎啟行發(fā)布VLA模型,起點(diǎn)是讓AI學(xué)會(huì)害怕?

