四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

叩擊L3之門,智能輔助駕駛的新十年往何處去?

掃一掃下載界面新聞APP

叩擊L3之門,智能輔助駕駛的新十年往何處去?

這條路沒有終點,而是人類與智能共處的新起點。

文|極智GeeTech  

任何一項技術(shù)在誕生伊始,圍繞發(fā)展路線的爭論總是伴隨左右,智能輔助駕駛技術(shù)也不例外。

該選擇從L2到L4級的漸進(jìn)式發(fā)展,還是直達(dá)L4終點的跨越式發(fā)展?是追隨純視覺技術(shù)路線的極致簡化,還是堅守多傳感器融合的冗余安全?行業(yè)標(biāo)準(zhǔn)的統(tǒng)一化與車企定制化如何平衡?垂直整合與開放聯(lián)盟的博弈將走向何方?

這些懸而未決的命題,恰恰證明了技術(shù)創(chuàng)新的旺盛生命力。在持續(xù)探索與實踐驗證中,智能輔助駕駛的未來演進(jìn)圖譜正逐漸清晰。

三級架構(gòu)下的算力躍升

過去十年,智能輔助駕駛系統(tǒng)的算力實現(xiàn)了從量變到質(zhì)變的跨越,其核心支撐在于“云端訓(xùn)練-邊緣推理-車端執(zhí)行”三級架構(gòu)的深度落地。通過將計算負(fù)荷從資源受限的車端向云端遷移,釋放出指數(shù)級增長的算力潛能。

云端作為智能輔助駕駛的“超級大腦”,已成為模型訓(xùn)練、數(shù)據(jù)閉環(huán)與算法迭代的核心載體。在端到端模型訓(xùn)練與Corner Case場景挖掘領(lǐng)域,云端算力的規(guī)模直接決定了智能輔助駕駛系統(tǒng)的進(jìn)化速度。

全球范圍內(nèi),特斯拉云端算力已突破88.5EFLOPS;國內(nèi)陣營中,吉利星睿智算中心以23.5EFLOPS領(lǐng)跑,華為突破10EFLOPS,理想與小米均達(dá)8.1EFLOPS,小鵬則計劃于2025年將云端算力從2.51 EFLOPS躍升至10EFLOPS,構(gòu)建更強(qiáng)大的訓(xùn)練基座。

車端作為實時決策的“邊緣終端”,算力正以指數(shù)級增速向千TOPS級別發(fā)起沖擊。L2級任務(wù)如自動泊車、城市NOA需數(shù)十至數(shù)百TOPS支撐,而L3及以上級別則需突破1000TOPS門檻,以滿足端到端模型實時推理需求。

在熱門的智能輔助駕駛方案中,蔚來NIO Pilot的車端算力達(dá)到1016TOPS;特斯拉FSD以720TOPS的算力緊隨其后;小鵬XNGP、理想AD PRO、小米Xiaomi Pilot Max、比亞迪天神之眼A和極氪千里浩瀚H7則實力相當(dāng),均為508TOPS;與之相比,華為ADS3.0的車端算力稍顯遜色,約為200TOPS。

邊緣算力作為車云協(xié)同的“神經(jīng)節(jié)點”,承擔(dān)著車端、路側(cè)與云端數(shù)據(jù)的實時協(xié)同重任,其標(biāo)準(zhǔn)化進(jìn)程直接影響L3級以上智能駕駛的落地效率。通過提升局部環(huán)境感知精度與交通優(yōu)化響應(yīng)速度,邊緣算力正成為高階智能駕駛不可或缺的技術(shù)基座。

高階智能輔助駕駛邁向“技術(shù)平權(quán)”

中國智能輔助駕駛正沿著場景復(fù)雜度梯度持續(xù)突破:從高速NOA在結(jié)構(gòu)化道路實現(xiàn)自動變道、匝道通行等基礎(chǔ)功能,到城市NOA攻克紅綠燈識別、無保護(hù)左轉(zhuǎn)等城市復(fù)雜場景,最終將實現(xiàn)全場景車位到車位(Door to Door,D2D)貫通,構(gòu)建“地庫-城區(qū)-高速”全鏈路智能駕駛體系,并融合自動充電、跨樓層泊車等終極場景。

這一演進(jìn)軌跡不僅標(biāo)志著技術(shù)范式從“規(guī)則驅(qū)動”向“數(shù)據(jù)驅(qū)動”的根本轉(zhuǎn)變,更意味著高階智能駕駛從“特定場景輔助”向“全旅程智能賦能”的價值躍升,其核心驅(qū)動力源于算法、數(shù)據(jù)、算力的三元協(xié)同突破。

算力端通過三級架構(gòu)實現(xiàn)量級躍遷,數(shù)據(jù)端依托真實與合成數(shù)據(jù)雙輪驅(qū)動突破長尾場景瓶頸,算法端從“規(guī)則引擎+模塊堆疊”向“數(shù)據(jù)引擎+端到端集成”進(jìn)化,完成“感知-決策-控制”全鏈路優(yōu)化。

2025年,高階智能駕駛的“科技平權(quán)”趨勢顯著提速。比亞迪將高速NOA功能下探至8萬元車型,小鵬城市NOA覆蓋至15萬元級市場,其余主流車企也將城市NOA功能下沉至10-20萬元車型,高階智能輔助駕駛的科技平權(quán)愈發(fā)顯露。

高階智能輔助駕駛科技平權(quán)的實現(xiàn)是軟件增效、硬件降本、規(guī)模擴(kuò)產(chǎn)三力共振的結(jié)果。在科技平權(quán)的推動下,L2及L2+高階智能輔助駕駛的市場規(guī)模與滲透率呈現(xiàn)爆發(fā)式增長,預(yù)計L2+滲透率將從2024年的8%躍升至2025年的15%,乘用車高階智駕市場正迎來爆發(fā)式增長周期。

數(shù)據(jù)閉環(huán)助推技術(shù)應(yīng)用“降本”

當(dāng)前,智駕輔助駕駛系統(tǒng)正經(jīng)歷從“硬件冗余堆砌”到“算法定義感知”的范式轉(zhuǎn)換,數(shù)據(jù)閉環(huán)生態(tài)成為這一變革的核心載體。從車端多模態(tài)傳感器被激活進(jìn)行采集開始,整臺“數(shù)據(jù)機(jī)器”的齒輪便開始轉(zhuǎn)動、嚙合、協(xié)同運(yùn)作。

首先,由傳感器采集的數(shù)據(jù)在車端實現(xiàn)格式標(biāo)準(zhǔn)化,經(jīng)由緩存得到預(yù)處理,繼而按照駕駛行為、環(huán)境參數(shù)和目標(biāo)物實時標(biāo)簽自動進(jìn)行元數(shù)據(jù)標(biāo)注。在標(biāo)簽符合特定條件的情況下,觸發(fā)事件分裝。

當(dāng)數(shù)據(jù)被傳輸?shù)竭叾撕螅?guī)則引擎和輕量化模型會根據(jù)不同精度做出篩選,最終獲得與智駕相關(guān)的高價值數(shù)據(jù)。根據(jù)算法,此類數(shù)據(jù)經(jīng)過壓縮與優(yōu)化得到分級存儲,并根據(jù)緊急度被歸入不同優(yōu)先級的上傳隊列。在此過程中,數(shù)據(jù)還將經(jīng)過脫敏處理,傳輸過程也將得到監(jiān)控,以達(dá)到最高的合規(guī)性和安全性。

最終,數(shù)據(jù)閉環(huán)將在云端形成。在這里,從邊端傳入的多源數(shù)據(jù)將完成入庫、標(biāo)簽及索引建立的步驟,并根據(jù)聚類算法實現(xiàn)自動化清洗,剔除沖突數(shù)據(jù)。

接下來,4D標(biāo)注工具鏈和數(shù)據(jù)合成工具將令保留下來的有效數(shù)據(jù)得到標(biāo)注和增強(qiáng);此后,經(jīng)過分布式模型訓(xùn)練、仿真驗證與部署、價值評估和合規(guī)審計等環(huán)節(jié),數(shù)據(jù)將正式完成閉環(huán)反饋與迭代。

隨著邊緣與云端算力的持續(xù)增強(qiáng),現(xiàn)實數(shù)據(jù)與合成數(shù)據(jù)的深度融合成為突破高階自動駕駛的關(guān)鍵路徑。動態(tài)數(shù)據(jù)蒸餾技術(shù)與多模態(tài)特征對齊算法的成熟,正逐步降低系統(tǒng)對硬件冗余的依賴,場景泛化能力隨之顯著提升。

這一趨勢直接推動核心感知部件成本的結(jié)構(gòu)性下降。過去一年,激光雷達(dá)均價從2500元降至1200元,降幅達(dá)52%;毫米波雷達(dá)、車載攝像頭、超聲波雷達(dá)價格降幅介于25%-31%之間,為高階智駕的規(guī)?;涞貟咔宄杀菊系K。

定位技術(shù)也在同步演進(jìn),從依賴激光雷達(dá)點云匹配與高精地圖的傳統(tǒng)模式,邁向無圖化與端到端模型新階段。

通過多攝像頭融合生成鳥瞰圖替代預(yù)置高精地圖,地圖維護(hù)成本大幅降低;車端海量數(shù)據(jù)構(gòu)建的云端仿真環(huán)境,持續(xù)強(qiáng)化模型對動態(tài)場景的泛化能力;視覺感知權(quán)重的提升,進(jìn)一步弱化了對激光雷達(dá)等高成本硬件的依賴。

長遠(yuǎn)來看,無圖化與端到端模型僅是過渡形態(tài)。當(dāng)車路云協(xié)同與自進(jìn)化學(xué)習(xí)成為技術(shù)核心,芯片級集成實現(xiàn)突破后,基于泛在智能(Ambient Intelligence)與生成式AI的全域動態(tài)定位將成為終極形態(tài)。

從“模塊化”到“端到端”的躍遷

智能駕駛算法正經(jīng)歷從模塊化堆疊到端到端集成的革命性演進(jìn),架構(gòu)創(chuàng)新成為技術(shù)突破的核心引擎。

端到端(end to end,E2E)架構(gòu)依托單一神經(jīng)網(wǎng)絡(luò)實現(xiàn)“感知-決策-控制”全流程運(yùn)算,直接輸出車輛控制指令。其無需人工規(guī)則干預(yù),通過海量數(shù)據(jù)訓(xùn)練可逼近人類直覺式?jīng)Q策,響應(yīng)效率與復(fù)雜工況適應(yīng)性顯著提升,但系統(tǒng)泛化能力受限于車企數(shù)據(jù)規(guī)模的閾值。

為突破這一局限,視覺-語言模型(VLM)作為增強(qiáng)模塊應(yīng)運(yùn)而生,其融合視覺感知與自然語言理解能力,解析復(fù)雜交通語義并通過鏈?zhǔn)酵评砩蓻Q策,與端到端架構(gòu)形成“快慢協(xié)同”的決策組合系統(tǒng),提升長尾場景與Corner Case的安全性。

但VLM對算力的消耗較大,且無法快速做出類似端到端那樣的直覺式響應(yīng)。此外,對于高精地圖的高度依賴也增加了維護(hù)成本,同時令泛化能力出現(xiàn)折損。

為此,智駕算法開發(fā)者在由“VLM+端到端”構(gòu)成的多段式端到端架構(gòu)上更進(jìn)一步,設(shè)計出一套性能更強(qiáng)的技術(shù)組合——視覺-語言-動作模型(Vision-Language-Action,VLA)。

VLA在VLM基礎(chǔ)上實現(xiàn)進(jìn)階,融合動作模態(tài)構(gòu)建“視覺-語言-動作”統(tǒng)一模型,完成“感知-決策-執(zhí)行”端到端閉環(huán)。

相比VLM和“VLM+端到端”,VLA是兼顧動作模態(tài),形成融合視覺、語言及動作的統(tǒng)一模型,其將多模態(tài)信息直接嵌入駕駛決策鏈,在提升泛化能力的同時大幅降低對數(shù)據(jù)的依賴。

尤為重要的是,其推理過程全程可求導(dǎo),可通過人機(jī)交互界面向用戶直觀展現(xiàn)推理過程和工作邏輯,增強(qiáng)用戶使用信心。

盡管優(yōu)勢顯著,但VLA仍面臨多重挑戰(zhàn)。VLA在同一架構(gòu)中集成視覺編碼器、語言編碼器和動作編碼器的需求,令工程化開發(fā)的難度陡增。同時,此類架構(gòu)數(shù)據(jù)需求及采集成本高,導(dǎo)致初期訓(xùn)練成本過高,且多模態(tài)感知對力反饋、物理交互等具身能力的支持不足。此外,計算實時性要求與當(dāng)前車域芯片算力存在矛盾,而黑箱決策風(fēng)險則降低了決策的可解釋性,增加調(diào)試難度等等。

因此,在VLA的研發(fā)門檻與落地成本得到有效控制前,“VLM+E2E”構(gòu)成的多段式端到端架構(gòu)仍是更具普惠性的主流選擇。

世界模型或成“類人智駕”引擎

在很大程度上,更先進(jìn)的云端算法將有助降低車端VLA架構(gòu)的訓(xùn)練難度,快速增強(qiáng)其泛化能力。而眼下,云端算法自身也在經(jīng)歷重大的技術(shù)革新。

從數(shù)據(jù)驅(qū)動的模仿學(xué)習(xí),到具備物理世界建模能力的生成式世界模型,云端算法發(fā)展的底層邏輯非常清晰:基于生成式AI技術(shù),通過合成虛擬場景構(gòu)建億公里級的里程閉環(huán)仿真系統(tǒng)。后者不僅包含出現(xiàn)在現(xiàn)實世界中的長尾場景,還能借助時空演化預(yù)測能力,模擬車輛在未知場景中(如極端天氣、交通事故等),由特定動作引發(fā)的環(huán)境變化。

此舉將大幅降低算法模型訓(xùn)練過程中,對現(xiàn)實世界駕駛數(shù)據(jù)的依賴,并且可在持續(xù)生成多模態(tài)訓(xùn)練數(shù)據(jù)的同時,融合增強(qiáng)型自學(xué)習(xí)機(jī)制,對駕駛策略做出以類人化為目標(biāo)的終極優(yōu)化。

另一方面,不斷進(jìn)化的車云協(xié)同蒸餾機(jī)制將有效提升車端VLA算法架構(gòu)的泛化能力,而從車端回流的實時數(shù)據(jù)則能反哺云端模型,助其合成長尾場景,驅(qū)動完成迭代,最終形成雙向增強(qiáng)的認(rèn)知進(jìn)化閉環(huán)。

更加不能忽視的一點是,云端世界模型高度整合了傳感器數(shù)據(jù)、交通規(guī)則、實踐經(jīng)驗等智駕要素,因此其本質(zhì)是一個能夠理解、推理和預(yù)測駕駛環(huán)境的AI框架。

伴隨其在感知與決策優(yōu)化方面的優(yōu)勢,云端世界模型可提供語義信息以提升智駕系統(tǒng)的環(huán)境識別能力,并預(yù)測周圍交通參與者的行為意圖,對決策規(guī)劃和車輛控制起到輔助作用。甚至在一定程度上,其出現(xiàn)有望取代車端的視覺語言模型,用云端算力幫助車端形成具有更高精度的場景推理能力。

目前,已有不少行業(yè)玩家開始在云端算力層面發(fā)力。例如,華為ADS 4.0公開宣稱其通過云端完成了高達(dá)6億公里的L3級智能輔助駕駛仿真驗證;小鵬汽車則披露了他們通過蒸餾壓縮云端模型參數(shù),實現(xiàn)輕量化車端部署的計劃。

此外,類似Momenta、地平線這樣的第三方智駕解決方案供應(yīng)商也已將世界模型與強(qiáng)化學(xué)習(xí)(Reinforcement Learning)相結(jié)合,對獎勵函數(shù)(Reward Function)設(shè)計做出優(yōu)化,令決策效率得到顯著提升。

盡管世界模型已逐步成為智駕系統(tǒng)云端算法的重要發(fā)展趨勢,但其對于數(shù)據(jù)質(zhì)量、多樣性以及車端實時算力的要求依然較高。此外,基于物理規(guī)則的三維建模能力,也將對其規(guī)?;虡I(yè)應(yīng)用構(gòu)成挑戰(zhàn)。

2025年全場景D2D功能的規(guī)?;涞?,以及年底至2026年即將量產(chǎn)上車的L3功能,促使智能輔助駕駛第三方供應(yīng)商、激光雷達(dá)廠商、線控企業(yè)、智能輔助駕駛圖商、數(shù)據(jù)標(biāo)注與仿真企業(yè)等愈發(fā)成為主機(jī)廠提升功能安全的關(guān)鍵生態(tài)伙伴。同時,全場景D2D功能帶來復(fù)雜的應(yīng)用場景,也使智能輔助駕駛芯片供應(yīng)商更加注重感知算法的業(yè)務(wù)布局。

隨著智能輔助駕駛功能的不斷發(fā)展,參與企業(yè)的市場競爭正在“縮圈”,未來市場集中度也將進(jìn)一步提升,能夠快速響應(yīng)主機(jī)廠需求以及具有AI能力的企業(yè)將脫穎而出。

當(dāng)L3之門正式開啟,我們看到的或許不只是方向盤短暫的“松手”,更是一場關(guān)于“智能邊界”的終極叩問。

三級算力架構(gòu)重構(gòu)了機(jī)器的思考速度,數(shù)據(jù)閉環(huán)消解了技術(shù)落地的成本壁壘,VLA與世界模型讓算法越來越接近人類的認(rèn)知邏輯??僧?dāng)智能輔助駕駛能處理99.99%的場景,那0.01%的未知該交給代碼還是人心?

或許,智能輔助駕駛的新十年,真正的考題從不在技術(shù)參數(shù)的小數(shù)點后幾位,而在每一次代碼迭代時,我們是否記得,讓機(jī)器學(xué)會駕駛的,從來不止是數(shù)據(jù)與算力,更是人類對于駕駛和出行最本真的期待——不是抵達(dá)終點的效率,而是路上每一刻的從容與安心。

在這扇L3的門后,藏著的從來不是技術(shù)的終點,而是人類學(xué)會如何與智能共處的新起點。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

叩擊L3之門,智能輔助駕駛的新十年往何處去?

這條路沒有終點,而是人類與智能共處的新起點。

文|極智GeeTech  

任何一項技術(shù)在誕生伊始,圍繞發(fā)展路線的爭論總是伴隨左右,智能輔助駕駛技術(shù)也不例外。

該選擇從L2到L4級的漸進(jìn)式發(fā)展,還是直達(dá)L4終點的跨越式發(fā)展?是追隨純視覺技術(shù)路線的極致簡化,還是堅守多傳感器融合的冗余安全?行業(yè)標(biāo)準(zhǔn)的統(tǒng)一化與車企定制化如何平衡?垂直整合與開放聯(lián)盟的博弈將走向何方?

這些懸而未決的命題,恰恰證明了技術(shù)創(chuàng)新的旺盛生命力。在持續(xù)探索與實踐驗證中,智能輔助駕駛的未來演進(jìn)圖譜正逐漸清晰。

三級架構(gòu)下的算力躍升

過去十年,智能輔助駕駛系統(tǒng)的算力實現(xiàn)了從量變到質(zhì)變的跨越,其核心支撐在于“云端訓(xùn)練-邊緣推理-車端執(zhí)行”三級架構(gòu)的深度落地。通過將計算負(fù)荷從資源受限的車端向云端遷移,釋放出指數(shù)級增長的算力潛能。

云端作為智能輔助駕駛的“超級大腦”,已成為模型訓(xùn)練、數(shù)據(jù)閉環(huán)與算法迭代的核心載體。在端到端模型訓(xùn)練與Corner Case場景挖掘領(lǐng)域,云端算力的規(guī)模直接決定了智能輔助駕駛系統(tǒng)的進(jìn)化速度。

全球范圍內(nèi),特斯拉云端算力已突破88.5EFLOPS;國內(nèi)陣營中,吉利星睿智算中心以23.5EFLOPS領(lǐng)跑,華為突破10EFLOPS,理想與小米均達(dá)8.1EFLOPS,小鵬則計劃于2025年將云端算力從2.51 EFLOPS躍升至10EFLOPS,構(gòu)建更強(qiáng)大的訓(xùn)練基座。

車端作為實時決策的“邊緣終端”,算力正以指數(shù)級增速向千TOPS級別發(fā)起沖擊。L2級任務(wù)如自動泊車、城市NOA需數(shù)十至數(shù)百TOPS支撐,而L3及以上級別則需突破1000TOPS門檻,以滿足端到端模型實時推理需求。

在熱門的智能輔助駕駛方案中,蔚來NIO Pilot的車端算力達(dá)到1016TOPS;特斯拉FSD以720TOPS的算力緊隨其后;小鵬XNGP、理想AD PRO、小米Xiaomi Pilot Max、比亞迪天神之眼A和極氪千里浩瀚H7則實力相當(dāng),均為508TOPS;與之相比,華為ADS3.0的車端算力稍顯遜色,約為200TOPS。

邊緣算力作為車云協(xié)同的“神經(jīng)節(jié)點”,承擔(dān)著車端、路側(cè)與云端數(shù)據(jù)的實時協(xié)同重任,其標(biāo)準(zhǔn)化進(jìn)程直接影響L3級以上智能駕駛的落地效率。通過提升局部環(huán)境感知精度與交通優(yōu)化響應(yīng)速度,邊緣算力正成為高階智能駕駛不可或缺的技術(shù)基座。

高階智能輔助駕駛邁向“技術(shù)平權(quán)”

中國智能輔助駕駛正沿著場景復(fù)雜度梯度持續(xù)突破:從高速NOA在結(jié)構(gòu)化道路實現(xiàn)自動變道、匝道通行等基礎(chǔ)功能,到城市NOA攻克紅綠燈識別、無保護(hù)左轉(zhuǎn)等城市復(fù)雜場景,最終將實現(xiàn)全場景車位到車位(Door to Door,D2D)貫通,構(gòu)建“地庫-城區(qū)-高速”全鏈路智能駕駛體系,并融合自動充電、跨樓層泊車等終極場景。

這一演進(jìn)軌跡不僅標(biāo)志著技術(shù)范式從“規(guī)則驅(qū)動”向“數(shù)據(jù)驅(qū)動”的根本轉(zhuǎn)變,更意味著高階智能駕駛從“特定場景輔助”向“全旅程智能賦能”的價值躍升,其核心驅(qū)動力源于算法、數(shù)據(jù)、算力的三元協(xié)同突破。

算力端通過三級架構(gòu)實現(xiàn)量級躍遷,數(shù)據(jù)端依托真實與合成數(shù)據(jù)雙輪驅(qū)動突破長尾場景瓶頸,算法端從“規(guī)則引擎+模塊堆疊”向“數(shù)據(jù)引擎+端到端集成”進(jìn)化,完成“感知-決策-控制”全鏈路優(yōu)化。

2025年,高階智能駕駛的“科技平權(quán)”趨勢顯著提速。比亞迪將高速NOA功能下探至8萬元車型,小鵬城市NOA覆蓋至15萬元級市場,其余主流車企也將城市NOA功能下沉至10-20萬元車型,高階智能輔助駕駛的科技平權(quán)愈發(fā)顯露。

高階智能輔助駕駛科技平權(quán)的實現(xiàn)是軟件增效、硬件降本、規(guī)模擴(kuò)產(chǎn)三力共振的結(jié)果。在科技平權(quán)的推動下,L2及L2+高階智能輔助駕駛的市場規(guī)模與滲透率呈現(xiàn)爆發(fā)式增長,預(yù)計L2+滲透率將從2024年的8%躍升至2025年的15%,乘用車高階智駕市場正迎來爆發(fā)式增長周期。

數(shù)據(jù)閉環(huán)助推技術(shù)應(yīng)用“降本”

當(dāng)前,智駕輔助駕駛系統(tǒng)正經(jīng)歷從“硬件冗余堆砌”到“算法定義感知”的范式轉(zhuǎn)換,數(shù)據(jù)閉環(huán)生態(tài)成為這一變革的核心載體。從車端多模態(tài)傳感器被激活進(jìn)行采集開始,整臺“數(shù)據(jù)機(jī)器”的齒輪便開始轉(zhuǎn)動、嚙合、協(xié)同運(yùn)作。

首先,由傳感器采集的數(shù)據(jù)在車端實現(xiàn)格式標(biāo)準(zhǔn)化,經(jīng)由緩存得到預(yù)處理,繼而按照駕駛行為、環(huán)境參數(shù)和目標(biāo)物實時標(biāo)簽自動進(jìn)行元數(shù)據(jù)標(biāo)注。在標(biāo)簽符合特定條件的情況下,觸發(fā)事件分裝。

當(dāng)數(shù)據(jù)被傳輸?shù)竭叾撕?,?guī)則引擎和輕量化模型會根據(jù)不同精度做出篩選,最終獲得與智駕相關(guān)的高價值數(shù)據(jù)。根據(jù)算法,此類數(shù)據(jù)經(jīng)過壓縮與優(yōu)化得到分級存儲,并根據(jù)緊急度被歸入不同優(yōu)先級的上傳隊列。在此過程中,數(shù)據(jù)還將經(jīng)過脫敏處理,傳輸過程也將得到監(jiān)控,以達(dá)到最高的合規(guī)性和安全性。

最終,數(shù)據(jù)閉環(huán)將在云端形成。在這里,從邊端傳入的多源數(shù)據(jù)將完成入庫、標(biāo)簽及索引建立的步驟,并根據(jù)聚類算法實現(xiàn)自動化清洗,剔除沖突數(shù)據(jù)。

接下來,4D標(biāo)注工具鏈和數(shù)據(jù)合成工具將令保留下來的有效數(shù)據(jù)得到標(biāo)注和增強(qiáng);此后,經(jīng)過分布式模型訓(xùn)練、仿真驗證與部署、價值評估和合規(guī)審計等環(huán)節(jié),數(shù)據(jù)將正式完成閉環(huán)反饋與迭代。

隨著邊緣與云端算力的持續(xù)增強(qiáng),現(xiàn)實數(shù)據(jù)與合成數(shù)據(jù)的深度融合成為突破高階自動駕駛的關(guān)鍵路徑。動態(tài)數(shù)據(jù)蒸餾技術(shù)與多模態(tài)特征對齊算法的成熟,正逐步降低系統(tǒng)對硬件冗余的依賴,場景泛化能力隨之顯著提升。

這一趨勢直接推動核心感知部件成本的結(jié)構(gòu)性下降。過去一年,激光雷達(dá)均價從2500元降至1200元,降幅達(dá)52%;毫米波雷達(dá)、車載攝像頭、超聲波雷達(dá)價格降幅介于25%-31%之間,為高階智駕的規(guī)模化落地掃清成本障礙。

定位技術(shù)也在同步演進(jìn),從依賴激光雷達(dá)點云匹配與高精地圖的傳統(tǒng)模式,邁向無圖化與端到端模型新階段。

通過多攝像頭融合生成鳥瞰圖替代預(yù)置高精地圖,地圖維護(hù)成本大幅降低;車端海量數(shù)據(jù)構(gòu)建的云端仿真環(huán)境,持續(xù)強(qiáng)化模型對動態(tài)場景的泛化能力;視覺感知權(quán)重的提升,進(jìn)一步弱化了對激光雷達(dá)等高成本硬件的依賴。

長遠(yuǎn)來看,無圖化與端到端模型僅是過渡形態(tài)。當(dāng)車路云協(xié)同與自進(jìn)化學(xué)習(xí)成為技術(shù)核心,芯片級集成實現(xiàn)突破后,基于泛在智能(Ambient Intelligence)與生成式AI的全域動態(tài)定位將成為終極形態(tài)。

從“模塊化”到“端到端”的躍遷

智能駕駛算法正經(jīng)歷從模塊化堆疊到端到端集成的革命性演進(jìn),架構(gòu)創(chuàng)新成為技術(shù)突破的核心引擎。

端到端(end to end,E2E)架構(gòu)依托單一神經(jīng)網(wǎng)絡(luò)實現(xiàn)“感知-決策-控制”全流程運(yùn)算,直接輸出車輛控制指令。其無需人工規(guī)則干預(yù),通過海量數(shù)據(jù)訓(xùn)練可逼近人類直覺式?jīng)Q策,響應(yīng)效率與復(fù)雜工況適應(yīng)性顯著提升,但系統(tǒng)泛化能力受限于車企數(shù)據(jù)規(guī)模的閾值。

為突破這一局限,視覺-語言模型(VLM)作為增強(qiáng)模塊應(yīng)運(yùn)而生,其融合視覺感知與自然語言理解能力,解析復(fù)雜交通語義并通過鏈?zhǔn)酵评砩蓻Q策,與端到端架構(gòu)形成“快慢協(xié)同”的決策組合系統(tǒng),提升長尾場景與Corner Case的安全性。

但VLM對算力的消耗較大,且無法快速做出類似端到端那樣的直覺式響應(yīng)。此外,對于高精地圖的高度依賴也增加了維護(hù)成本,同時令泛化能力出現(xiàn)折損。

為此,智駕算法開發(fā)者在由“VLM+端到端”構(gòu)成的多段式端到端架構(gòu)上更進(jìn)一步,設(shè)計出一套性能更強(qiáng)的技術(shù)組合——視覺-語言-動作模型(Vision-Language-Action,VLA)。

VLA在VLM基礎(chǔ)上實現(xiàn)進(jìn)階,融合動作模態(tài)構(gòu)建“視覺-語言-動作”統(tǒng)一模型,完成“感知-決策-執(zhí)行”端到端閉環(huán)。

相比VLM和“VLM+端到端”,VLA是兼顧動作模態(tài),形成融合視覺、語言及動作的統(tǒng)一模型,其將多模態(tài)信息直接嵌入駕駛決策鏈,在提升泛化能力的同時大幅降低對數(shù)據(jù)的依賴。

尤為重要的是,其推理過程全程可求導(dǎo),可通過人機(jī)交互界面向用戶直觀展現(xiàn)推理過程和工作邏輯,增強(qiáng)用戶使用信心。

盡管優(yōu)勢顯著,但VLA仍面臨多重挑戰(zhàn)。VLA在同一架構(gòu)中集成視覺編碼器、語言編碼器和動作編碼器的需求,令工程化開發(fā)的難度陡增。同時,此類架構(gòu)數(shù)據(jù)需求及采集成本高,導(dǎo)致初期訓(xùn)練成本過高,且多模態(tài)感知對力反饋、物理交互等具身能力的支持不足。此外,計算實時性要求與當(dāng)前車域芯片算力存在矛盾,而黑箱決策風(fēng)險則降低了決策的可解釋性,增加調(diào)試難度等等。

因此,在VLA的研發(fā)門檻與落地成本得到有效控制前,“VLM+E2E”構(gòu)成的多段式端到端架構(gòu)仍是更具普惠性的主流選擇。

世界模型或成“類人智駕”引擎

在很大程度上,更先進(jìn)的云端算法將有助降低車端VLA架構(gòu)的訓(xùn)練難度,快速增強(qiáng)其泛化能力。而眼下,云端算法自身也在經(jīng)歷重大的技術(shù)革新。

從數(shù)據(jù)驅(qū)動的模仿學(xué)習(xí),到具備物理世界建模能力的生成式世界模型,云端算法發(fā)展的底層邏輯非常清晰:基于生成式AI技術(shù),通過合成虛擬場景構(gòu)建億公里級的里程閉環(huán)仿真系統(tǒng)。后者不僅包含出現(xiàn)在現(xiàn)實世界中的長尾場景,還能借助時空演化預(yù)測能力,模擬車輛在未知場景中(如極端天氣、交通事故等),由特定動作引發(fā)的環(huán)境變化。

此舉將大幅降低算法模型訓(xùn)練過程中,對現(xiàn)實世界駕駛數(shù)據(jù)的依賴,并且可在持續(xù)生成多模態(tài)訓(xùn)練數(shù)據(jù)的同時,融合增強(qiáng)型自學(xué)習(xí)機(jī)制,對駕駛策略做出以類人化為目標(biāo)的終極優(yōu)化。

另一方面,不斷進(jìn)化的車云協(xié)同蒸餾機(jī)制將有效提升車端VLA算法架構(gòu)的泛化能力,而從車端回流的實時數(shù)據(jù)則能反哺云端模型,助其合成長尾場景,驅(qū)動完成迭代,最終形成雙向增強(qiáng)的認(rèn)知進(jìn)化閉環(huán)。

更加不能忽視的一點是,云端世界模型高度整合了傳感器數(shù)據(jù)、交通規(guī)則、實踐經(jīng)驗等智駕要素,因此其本質(zhì)是一個能夠理解、推理和預(yù)測駕駛環(huán)境的AI框架。

伴隨其在感知與決策優(yōu)化方面的優(yōu)勢,云端世界模型可提供語義信息以提升智駕系統(tǒng)的環(huán)境識別能力,并預(yù)測周圍交通參與者的行為意圖,對決策規(guī)劃和車輛控制起到輔助作用。甚至在一定程度上,其出現(xiàn)有望取代車端的視覺語言模型,用云端算力幫助車端形成具有更高精度的場景推理能力。

目前,已有不少行業(yè)玩家開始在云端算力層面發(fā)力。例如,華為ADS 4.0公開宣稱其通過云端完成了高達(dá)6億公里的L3級智能輔助駕駛仿真驗證;小鵬汽車則披露了他們通過蒸餾壓縮云端模型參數(shù),實現(xiàn)輕量化車端部署的計劃。

此外,類似Momenta、地平線這樣的第三方智駕解決方案供應(yīng)商也已將世界模型與強(qiáng)化學(xué)習(xí)(Reinforcement Learning)相結(jié)合,對獎勵函數(shù)(Reward Function)設(shè)計做出優(yōu)化,令決策效率得到顯著提升。

盡管世界模型已逐步成為智駕系統(tǒng)云端算法的重要發(fā)展趨勢,但其對于數(shù)據(jù)質(zhì)量、多樣性以及車端實時算力的要求依然較高。此外,基于物理規(guī)則的三維建模能力,也將對其規(guī)?;虡I(yè)應(yīng)用構(gòu)成挑戰(zhàn)。

2025年全場景D2D功能的規(guī)?;涞?,以及年底至2026年即將量產(chǎn)上車的L3功能,促使智能輔助駕駛第三方供應(yīng)商、激光雷達(dá)廠商、線控企業(yè)、智能輔助駕駛圖商、數(shù)據(jù)標(biāo)注與仿真企業(yè)等愈發(fā)成為主機(jī)廠提升功能安全的關(guān)鍵生態(tài)伙伴。同時,全場景D2D功能帶來復(fù)雜的應(yīng)用場景,也使智能輔助駕駛芯片供應(yīng)商更加注重感知算法的業(yè)務(wù)布局。

隨著智能輔助駕駛功能的不斷發(fā)展,參與企業(yè)的市場競爭正在“縮圈”,未來市場集中度也將進(jìn)一步提升,能夠快速響應(yīng)主機(jī)廠需求以及具有AI能力的企業(yè)將脫穎而出。

當(dāng)L3之門正式開啟,我們看到的或許不只是方向盤短暫的“松手”,更是一場關(guān)于“智能邊界”的終極叩問。

三級算力架構(gòu)重構(gòu)了機(jī)器的思考速度,數(shù)據(jù)閉環(huán)消解了技術(shù)落地的成本壁壘,VLA與世界模型讓算法越來越接近人類的認(rèn)知邏輯??僧?dāng)智能輔助駕駛能處理99.99%的場景,那0.01%的未知該交給代碼還是人心?

或許,智能輔助駕駛的新十年,真正的考題從不在技術(shù)參數(shù)的小數(shù)點后幾位,而在每一次代碼迭代時,我們是否記得,讓機(jī)器學(xué)會駕駛的,從來不止是數(shù)據(jù)與算力,更是人類對于駕駛和出行最本真的期待——不是抵達(dá)終點的效率,而是路上每一刻的從容與安心。

在這扇L3的門后,藏著的從來不是技術(shù)的終點,而是人類學(xué)會如何與智能共處的新起點。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。