四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

特斯拉已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”

掃一掃下載界面新聞APP

特斯拉已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”

掉下神壇的特斯拉,現(xiàn)在需要更腳踏實(shí)地。

文 | 飛說智行11 周雄飛

時(shí)隔兩年多,特斯拉再次“開麥”。

與此前不同,這次特斯拉對(duì)于自家智能輔助駕駛算法進(jìn)展的分享,并不是在AI Day的舞臺(tái)上,而是在近日舉辦的計(jì)算機(jī)視覺頂會(huì)ICCV(International Conference on Computer Vision)期間。

特斯拉自動(dòng)駕駛副總裁阿肖克·埃魯斯瓦米(Ashok Elluswamy)作為嘉賓,在大會(huì)上發(fā)表了主題演講。

有可能為了接上2023年6月他們提出端到端架構(gòu)之后的“閉麥”,阿肖克從“特斯拉為何會(huì)選擇端到端?”開始分享,但經(jīng)過多年實(shí)踐,他們也發(fā)現(xiàn)僅通過端到端想要做好智能輔助駕駛,存在一些挑戰(zhàn)。

圖源Tesla AI

首先就是端到端系統(tǒng)需要解決從極高維到極低維的映射問題,這種映射往往是多對(duì)一,因此要保證輸出的正確性,訓(xùn)練難度可想而知。阿肖克的言外之意,或許是在強(qiáng)調(diào)端到端模型的“黑箱”問題。

基于特斯拉龐大的用戶規(guī)模,每日可為他們產(chǎn)生相當(dāng)于500年駕駛時(shí)長的數(shù)據(jù),但其中多數(shù)是沒有太多價(jià)值的常規(guī)場景數(shù)據(jù),對(duì)于算法的長遠(yuǎn)泛化沒有太大幫助。

為了解決這兩個(gè)問題,特斯拉在架構(gòu)和算法層面做了一些優(yōu)化和調(diào)整,比如在輸出決策控制指令前,還會(huì)輸出OCC占用網(wǎng)絡(luò)和3D高斯特征等視覺信息,以及思維鏈COT自然語言信息。

與此同時(shí),基于龐大的真實(shí)數(shù)據(jù)基礎(chǔ),特斯拉還建立了名為“神經(jīng)世界模擬器”的閉環(huán)仿真系統(tǒng)。通過這套系統(tǒng),不僅可以訓(xùn)練算法,并且還能驗(yàn)證算法的正確性,好比同時(shí)是“訓(xùn)練場”和“考試場地”。

看到這里,是不是聞到有股熟悉的味道,這不就是國內(nèi)車企們和自動(dòng)駕駛企業(yè)布局的VLA模型和世界模型。換句話說,特斯拉已從之前站在講臺(tái)上的“老師”,變成了與理想、小鵬、吉利、華為、地平線和Momenta一起探索智駕最終答案的“同學(xué)”。

或許正因這樣,小鵬汽車CEO何小鵬曾表示:“實(shí)際上,國內(nèi)任何一家有實(shí)力AI玩家,早就不care馬斯克在做什么了”。

不僅如此,曾負(fù)責(zé)特斯拉Autopilot和自動(dòng)駕駛項(xiàng)目的兩位前高管,在這段時(shí)間也對(duì)特斯拉自動(dòng)駕駛進(jìn)程表達(dá)了擔(dān)憂。畢竟,根據(jù)特斯拉最新的財(cái)報(bào),訂閱FSD的比例只有約12%。

已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”的特斯拉,未來將會(huì)駛向何方?

01 VLA vs 世界模型,特斯拉:我全都要

提出端到端架構(gòu)兩年后,特斯拉他們依然覺得該架構(gòu)很重要。

首先端到端架構(gòu)能減少從感知輸入端到控制輸出端的信息損失,就像面對(duì)雞、鵝等小動(dòng)物過馬路這個(gè)場景,傳統(tǒng)模塊化模型就會(huì)在信息傳輸過程中丟失一部分信息,導(dǎo)致輸出端形成信息瓶頸無法做出正確行動(dòng)。

但端到端架構(gòu),就可以確保決策和控制端依然能基于豐富的信息,再加上神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)驅(qū)動(dòng)從大量人類駕駛行為中學(xué)習(xí)到“經(jīng)驗(yàn)”,從而做出正確、安全和有效的駕駛行為。

正因這樣,整個(gè)端到端架構(gòu)的信息密度是巨大的??梢院唵嗡阋还P賬:輸入端在30秒內(nèi)以36Hz頻率采集的7路500萬像素?cái)z像頭視頻、長達(dá)數(shù)英里的導(dǎo)航地圖、100Hz的車速與IMU信息,甚至還有大量的音頻信息,整體信息維度相當(dāng)于20億token。

對(duì)于特斯拉來說,輸出端僅是方向和加減速的控制信息,約等于2個(gè)token,這就意味著端到端需要解決的是從極高維信息到極低維信息、多對(duì)一的映射問題,就好比要從一團(tuán)亂麻中找到最終指引向出口的那唯一一根正確線頭。

端到端模型,圖源SEA

翻譯一下,阿肖克所說的正是行業(yè)中老生常談的——端到端由于存在信息維度壓縮和深度神經(jīng)網(wǎng)絡(luò)非線性等特性,導(dǎo)致“黑箱”和不可解釋性問題不可避免。

另外,在訓(xùn)練數(shù)據(jù)上,特斯拉同樣遇到了瓶頸。按照阿肖克介紹,基于龐大的用戶群體,特斯拉每天可接收相當(dāng)于500年駕駛時(shí)長的數(shù)據(jù),這個(gè)數(shù)據(jù)量放到行業(yè)中看確實(shí)令人艷羨,但其中大多數(shù)數(shù)據(jù)卻都屬于簡單和常規(guī)場景。

換句話說,特斯拉正像中國玩家們一樣,缺少真實(shí)的高質(zhì)量數(shù)據(jù)來“喂養(yǎng)”算法。畢竟訓(xùn)練所需的高質(zhì)量難例數(shù)據(jù)可遇不可求,地平線CEO余凱由此才會(huì)說出那句“在AI時(shí)代,99%的人類數(shù)據(jù)是不值得學(xué)習(xí)的”。

特斯拉這次技術(shù)分享的重頭戲,正是他們對(duì)于以上問題提出的解法。

針對(duì)特斯拉最新的端到端架構(gòu),阿肖克表示“并不是徹頭徹尾的‘黑箱’系統(tǒng)”。從他的介紹看,現(xiàn)在的端到端架構(gòu)在輸出決策規(guī)劃信號(hào)之前,還輸出了很多中間結(jié)果,包括OCC占用網(wǎng)絡(luò)和3D高斯特征為主的場景重建視覺信息,來展現(xiàn)對(duì)于環(huán)境的感知細(xì)節(jié)。

除此之外,特斯拉還引入了思維鏈COT(Chain-of-Thought),訓(xùn)練算法用自然語言來解釋自己的行為,并給出下一步的行動(dòng)軌跡。這些中間結(jié)果,不僅可用于SR界面的渲染呈現(xiàn),同時(shí)也能用于研發(fā)校驗(yàn)和調(diào)優(yōu),來保證模型輸出的正確性。

特斯拉具備可解釋輸出模型,圖源Tesla AI

理想車主們對(duì)于以上描述應(yīng)該非常熟悉,因?yàn)槭撬麄冊(cè)谇芭牌聊簧辖?jīng)??吹降穆窂揭?guī)劃和思維過程的畫面。這就是VLA模型中的“L”(Language)部分,再加上V(Vision)的2D、3D信息,以及MoE、Diffusion模型和A(Action)的部分,就組成了VLA模型。

目前,除了理想之外,小鵬、元戎啟行和千里科技(千里浩瀚9H方案)等品牌,也都采用了VLA架構(gòu)來打造自身的智駕系統(tǒng)或者方案,讓自身的智駕功能不僅適于與用戶交互,同時(shí)也能讓智駕行為更像人。

對(duì)于特斯拉來說,目標(biāo)是一致的,但他們同時(shí)還在致力于打造一個(gè)算法評(píng)價(jià)模型。

以阿肖克的介紹來看,他們已經(jīng)基于龐大的真實(shí)用戶數(shù)據(jù),在云端打造了一個(gè)“神經(jīng)世界模擬器”(neural world simulator)。

它的用途有三個(gè),利用閉環(huán)仿真驗(yàn)證端到端指令的正確性、利用場景編輯生成能力生成對(duì)抗樣本檢驗(yàn)?zāi)P湍芰屠媚M器在閉環(huán)仿真系統(tǒng)中獲取人駕真值。

翻譯一下,就是基于真實(shí)用戶駕駛視頻數(shù)據(jù),一邊來生成在現(xiàn)實(shí)世界難獲取的難例(Corner cases)數(shù)據(jù),從而在云端訓(xùn)練和迭代智駕算法模型;另一邊,把訓(xùn)練好的算法模型放到生成好的世界模型中進(jìn)行仿真權(quán)重評(píng)價(jià)測試,針對(duì)性通過強(qiáng)化學(xué)習(xí)來增強(qiáng)模型能力。

就像是特斯拉為FSD在云端打造了一個(gè)閉環(huán)的“駕?!焙汀翱紙鰣龅亍?。相比于現(xiàn)實(shí)世界中高質(zhì)量數(shù)據(jù)的難獲得,在神經(jīng)世界模擬器中就可以讓算法訓(xùn)練和評(píng)價(jià)實(shí)現(xiàn)窮盡。

特斯拉閉環(huán)模擬神經(jīng)網(wǎng)絡(luò)模型,圖源Tesla AI

實(shí)際上,像這樣的云端世界模型,并不是特斯拉首創(chuàng),而是像理想、小鵬、零跑、華為乾崑和商湯絕影等國內(nèi)玩家已經(jīng)早已布局。

這其中,以華為乾崑為代表的玩家們,在打造云端世界模型的同時(shí),還在車端部署了世界模型,就像華為乾崑的車端世界行為模型WA,是基于視覺、聽覺和觸覺等感知數(shù)據(jù),經(jīng)過Token化后訓(xùn)練出的原生基模型。

由此,在國內(nèi)智駕行業(yè)中就有了端到端、VLA和世界模型的三種技術(shù)路線之爭,但從以上分析來看,特斯拉的最新智駕方案有可能把端到端、VLA模型和世界模型三者都涵蓋了。

特斯拉他們會(huì)這樣選擇,并不是只為了“集百家之長”這樣簡單,因?yàn)樵陲w說智行看來,端到端、VLA和世界模型并不是簡單的非此即彼競爭關(guān)系,而是端到端為基礎(chǔ)、VLA和世界模型是升級(jí)的動(dòng)態(tài)融合演進(jìn)關(guān)系。

例如上述主流玩家們無論在車端部署端到端還是VLA模型,亦或者是世界模型,都需要在云端建立一個(gè)參數(shù)量更大的世界模型進(jìn)行仿真生成訓(xùn)練和評(píng)價(jià),并且還有一些玩家車端的模型,就是云端世界模型通過修剪和蒸餾所得。由此,何小鵬、李想和余承東等大佬此前都對(duì)世界模型給予了肯定的評(píng)價(jià)。

除此之外,特斯拉布局VLA和世界模型的目的,還想去支持機(jī)器人業(yè)務(wù)的發(fā)展。

按照阿肖克表示,特斯拉閉環(huán)仿真引擎同樣可以遷移到機(jī)器人領(lǐng)域,而機(jī)器人Optimus和自動(dòng)駕駛FSD技術(shù)棧的統(tǒng)一,也為后續(xù)Cross Embodiment(跨實(shí)體具身)帶來的更泛化的具身AI發(fā)展帶來巨大的想象空間。

圖源特斯拉官微

相比之下,理想和小鵬兩家車企布局VLA和世界模型的時(shí)間更早,并且都已喊出了“要成為AI企業(yè)”的目標(biāo),他們應(yīng)該和特斯拉有著同樣的規(guī)劃。

只不過,相比于之前舉辦AI Day的特斯拉,現(xiàn)在的特斯拉已經(jīng)掉下神壇,與理想、小鵬、華為乾崑和地平線等國內(nèi)玩家們站到了一起。

根據(jù)飛說智行觀察,這次特斯拉分享技術(shù)進(jìn)展后,與之前AI Day后朋友圈刷屏的熱度相比冷清了許多,由此也能看出大家對(duì)于特斯拉在干什么,確實(shí)沒有之前那么關(guān)注了。

畢竟除了技術(shù)進(jìn)展之外,特斯拉在其他方面的成績也不夠亮眼。

02 謊言、質(zhì)疑和不愛用,特斯拉FSD未來駛向何處?

都2025年了,馬斯克依舊在為自動(dòng)駕駛“畫餅”。

在最近的第三季度財(cái)報(bào)會(huì)上,馬斯克表示特斯拉有望在今年年底前在8到10個(gè)新的州展開Robotaxi運(yùn)營,其中就包括內(nèi)華達(dá)州、佛羅里達(dá)州和亞利桑那州等對(duì)自動(dòng)駕駛技術(shù)政策寬松的大州。

而在上個(gè)季度的財(cái)報(bào)會(huì)上,馬斯克曾表示,特斯拉會(huì)在今年底前讓Robotaxi覆蓋美國50%的人口,并預(yù)計(jì)到今年底,特斯拉車主將能通過軟件更新,使自己的車輛具備無需監(jiān)督的全自動(dòng)駕駛能力(L5)。

對(duì)于馬斯克這樣的“畫餅”,大家早已司空見慣,畢竟從2016年開始,馬斯克就開始鼓吹自家FSD可以盡早實(shí)現(xiàn)全自動(dòng)駕駛的目標(biāo),但每到兌現(xiàn)期限無一例外跳票。

正因這樣,曾負(fù)責(zé)特斯拉自動(dòng)駕駛業(yè)務(wù)的前高管們看不下去了。

特斯拉前人工智能主管安德烈·卡帕西(Andrej Karpathy)最近在一檔播客中表示特斯拉自動(dòng)駕駛的問題遠(yuǎn)未得到解決,據(jù)了解他曾在2017-2022年領(lǐng)導(dǎo)特斯拉自動(dòng)駕駛項(xiàng)目。

在安德烈看來,自動(dòng)駕駛的迭代好比是無限接近100%的過程,在此之前就是無數(shù)個(gè)9的積累過程,按照他對(duì)Electrek回憶道,他曾領(lǐng)導(dǎo)特斯拉自動(dòng)駕駛經(jīng)歷了兩到三個(gè)“9”的迭代,確實(shí)顯著減少了駕駛員接管的干預(yù),但此后這樣的進(jìn)步就不明顯了。

特斯拉無接管駕駛干預(yù)百分比,圖源Electrek

安德烈之前,斯特林·安德森被行業(yè)公認(rèn)為是特斯拉自動(dòng)駕駛項(xiàng)目的首任負(fù)責(zé)人,因?yàn)樗?015-2016年領(lǐng)導(dǎo)特斯拉Autopilot發(fā)展,目前他已是通用汽車全球產(chǎn)品部門的負(fù)責(zé)人。

在近期通用汽車的活動(dòng)中,斯特林對(duì)特斯拉自動(dòng)駕駛的發(fā)展同樣進(jìn)行了質(zhì)疑,“通用Super Cruise系統(tǒng)已實(shí)現(xiàn)約11億公里的無接管行駛,且沒有發(fā)生一起由于技術(shù)導(dǎo)致的事故。但特斯拉的自動(dòng)駕駛系統(tǒng),卻無法達(dá)到這樣的安全記錄。”

在此背景下,目前特斯拉在奧斯汀和舊金山運(yùn)營的Robotaxi車輛均配備安全員,以便作為系統(tǒng)失效或錯(cuò)誤時(shí)的安全兜底。其中,奧斯汀區(qū)域的Robotaxi,安全員是坐在副駕位置;而在舊金山,安全員則是坐在主駕。

根據(jù)馬斯克的規(guī)劃,會(huì)在今年底前去掉奧斯汀大部分的安全員配置,未來幾個(gè)月內(nèi),預(yù)期至少在奧斯汀的部分區(qū)域?qū)崿F(xiàn)完全無安全駕駛員運(yùn)營。為此,馬斯克給出的解釋是“這些人類監(jiān)控員的存在并非因?yàn)楣炯夹g(shù)存在缺陷,而是出于對(duì)安全的‘高度謹(jǐn)慎’”。

不過,先不說與特斯拉同場競技的Waymo已經(jīng)實(shí)現(xiàn)了無安全員的商業(yè)化運(yùn)營,小馬智行、文遠(yuǎn)知行和蘿卜快跑等中國玩家們,則是更早就實(shí)現(xiàn)了Robotaxi無安全員的常態(tài)化運(yùn)營。

Robotaxi沒有按照馬斯克所期望的速度發(fā)展的同時(shí),特斯拉的智能輔助駕駛業(yè)務(wù)發(fā)展同樣受阻。

特斯拉第三季度財(cái)報(bào)會(huì)上,特斯拉首席財(cái)務(wù)官瓦伊巴夫?塔內(nèi)賈(Vaibhav Taneja)公開承認(rèn),上一季度FSD相關(guān)的收入較2024年同期有所下滑,具體原因是“目前付費(fèi)使用FSD的客戶總量仍然很小,僅占現(xiàn)有車隊(duì)的約12%”。

特斯拉FSD,圖源特斯拉官微

今年特斯拉對(duì)于FSD在美國市場的售價(jià)雖然進(jìn)行了調(diào)價(jià),買斷價(jià)從之前的12000美元(約合85350元人民幣)降至8000美元(約合56900元人民幣),并推出了99美元的月度訂閱服務(wù)。

但結(jié)果是,不僅沒有促進(jìn)用戶們對(duì)于FSD的購買和訂閱,反而FSD成為消費(fèi)者們不購買特斯拉的主要原因。

根據(jù)Slingshot Strategies在今年8月發(fā)布的《2025年8月電動(dòng)汽車情報(bào)報(bào)告》,他們對(duì)8000多名美國消費(fèi)者進(jìn)行調(diào)研后發(fā)現(xiàn),有將近35%的受訪者認(rèn)為“FSD功能讓他們更不愿意購買特斯拉”,因?yàn)樗麄儗?duì)FSD技術(shù)不成熟,責(zé)任界定模糊和純視覺方案可靠性不足等方面有所擔(dān)憂。

這些消費(fèi)者的擔(dān)憂并不是沒有道理。本月9日,美國國家公路交通安全管理局(NHTSA)宣布對(duì)約288萬輛配備FSD的特斯拉汽車展開調(diào)查,起因是收到58起交通安全違規(guī)及事故報(bào)告,涉及闖紅燈、逆行、車道識(shí)別錯(cuò)誤等問題。

其中就包括當(dāng)特斯拉車輛開啟FSD之后,在路口與其他車輛相撞以及誤駛向?qū)ο蜍嚨琅c別車相撞,導(dǎo)致多名人員受傷等多起事故。

03 后記

特斯拉對(duì)于全球自動(dòng)駕駛行業(yè)來說,有著重要的價(jià)值。

基于特斯拉前些年相繼提出BEV+Transformer、OCC占用網(wǎng)絡(luò)以及端到端模型,不可否認(rèn)在一定程度上給于中國玩家們很多啟發(fā),由此推動(dòng)了整個(gè)行業(yè)向前快速發(fā)展。

兩年前,或許因?yàn)椤皳?dān)心中國車企玩家們的模仿”傳言,馬斯克和特斯拉選擇了“閉麥”,AI Day就此停辦不再對(duì)外分享自動(dòng)駕駛相關(guān)技術(shù)進(jìn)展。

再到兩年后的今天,理想、小鵬、吉利、華為乾崑、地平線和Momenta等玩家雖然在技術(shù)路線上已有“三足鼎立”之勢,但馬斯克應(yīng)該也看到了一個(gè)事實(shí):特斯拉已不是行業(yè)的“標(biāo)準(zhǔn)答案”,大家都在按照自己認(rèn)定的方向向自動(dòng)駕駛終局進(jìn)行探索。

畢竟,自動(dòng)駕駛行業(yè)從不缺少“神話”,而馬斯克和特斯拉現(xiàn)在則需要更腳踏實(shí)地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

特斯拉

5.1k
  • 馬斯克:若重來,不會(huì)領(lǐng)導(dǎo)“政府效率部”
  • 特斯拉股價(jià)跌超3%,摩根士丹利兩年多來首次下調(diào)其評(píng)級(jí)

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

特斯拉已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”

掉下神壇的特斯拉,現(xiàn)在需要更腳踏實(shí)地。

文 | 飛說智行11 周雄飛

時(shí)隔兩年多,特斯拉再次“開麥”。

與此前不同,這次特斯拉對(duì)于自家智能輔助駕駛算法進(jìn)展的分享,并不是在AI Day的舞臺(tái)上,而是在近日舉辦的計(jì)算機(jī)視覺頂會(huì)ICCV(International Conference on Computer Vision)期間。

特斯拉自動(dòng)駕駛副總裁阿肖克·埃魯斯瓦米(Ashok Elluswamy)作為嘉賓,在大會(huì)上發(fā)表了主題演講。

有可能為了接上2023年6月他們提出端到端架構(gòu)之后的“閉麥”,阿肖克從“特斯拉為何會(huì)選擇端到端?”開始分享,但經(jīng)過多年實(shí)踐,他們也發(fā)現(xiàn)僅通過端到端想要做好智能輔助駕駛,存在一些挑戰(zhàn)。

圖源Tesla AI

首先就是端到端系統(tǒng)需要解決從極高維到極低維的映射問題,這種映射往往是多對(duì)一,因此要保證輸出的正確性,訓(xùn)練難度可想而知。阿肖克的言外之意,或許是在強(qiáng)調(diào)端到端模型的“黑箱”問題。

基于特斯拉龐大的用戶規(guī)模,每日可為他們產(chǎn)生相當(dāng)于500年駕駛時(shí)長的數(shù)據(jù),但其中多數(shù)是沒有太多價(jià)值的常規(guī)場景數(shù)據(jù),對(duì)于算法的長遠(yuǎn)泛化沒有太大幫助。

為了解決這兩個(gè)問題,特斯拉在架構(gòu)和算法層面做了一些優(yōu)化和調(diào)整,比如在輸出決策控制指令前,還會(huì)輸出OCC占用網(wǎng)絡(luò)和3D高斯特征等視覺信息,以及思維鏈COT自然語言信息。

與此同時(shí),基于龐大的真實(shí)數(shù)據(jù)基礎(chǔ),特斯拉還建立了名為“神經(jīng)世界模擬器”的閉環(huán)仿真系統(tǒng)。通過這套系統(tǒng),不僅可以訓(xùn)練算法,并且還能驗(yàn)證算法的正確性,好比同時(shí)是“訓(xùn)練場”和“考試場地”。

看到這里,是不是聞到有股熟悉的味道,這不就是國內(nèi)車企們和自動(dòng)駕駛企業(yè)布局的VLA模型和世界模型。換句話說,特斯拉已從之前站在講臺(tái)上的“老師”,變成了與理想、小鵬、吉利、華為、地平線和Momenta一起探索智駕最終答案的“同學(xué)”。

或許正因這樣,小鵬汽車CEO何小鵬曾表示:“實(shí)際上,國內(nèi)任何一家有實(shí)力AI玩家,早就不care馬斯克在做什么了”。

不僅如此,曾負(fù)責(zé)特斯拉Autopilot和自動(dòng)駕駛項(xiàng)目的兩位前高管,在這段時(shí)間也對(duì)特斯拉自動(dòng)駕駛進(jìn)程表達(dá)了擔(dān)憂。畢竟,根據(jù)特斯拉最新的財(cái)報(bào),訂閱FSD的比例只有約12%。

已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”的特斯拉,未來將會(huì)駛向何方?

01 VLA vs 世界模型,特斯拉:我全都要

提出端到端架構(gòu)兩年后,特斯拉他們依然覺得該架構(gòu)很重要。

首先端到端架構(gòu)能減少從感知輸入端到控制輸出端的信息損失,就像面對(duì)雞、鵝等小動(dòng)物過馬路這個(gè)場景,傳統(tǒng)模塊化模型就會(huì)在信息傳輸過程中丟失一部分信息,導(dǎo)致輸出端形成信息瓶頸無法做出正確行動(dòng)。

但端到端架構(gòu),就可以確保決策和控制端依然能基于豐富的信息,再加上神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)驅(qū)動(dòng)從大量人類駕駛行為中學(xué)習(xí)到“經(jīng)驗(yàn)”,從而做出正確、安全和有效的駕駛行為。

正因這樣,整個(gè)端到端架構(gòu)的信息密度是巨大的??梢院唵嗡阋还P賬:輸入端在30秒內(nèi)以36Hz頻率采集的7路500萬像素?cái)z像頭視頻、長達(dá)數(shù)英里的導(dǎo)航地圖、100Hz的車速與IMU信息,甚至還有大量的音頻信息,整體信息維度相當(dāng)于20億token。

對(duì)于特斯拉來說,輸出端僅是方向和加減速的控制信息,約等于2個(gè)token,這就意味著端到端需要解決的是從極高維信息到極低維信息、多對(duì)一的映射問題,就好比要從一團(tuán)亂麻中找到最終指引向出口的那唯一一根正確線頭。

端到端模型,圖源SEA

翻譯一下,阿肖克所說的正是行業(yè)中老生常談的——端到端由于存在信息維度壓縮和深度神經(jīng)網(wǎng)絡(luò)非線性等特性,導(dǎo)致“黑箱”和不可解釋性問題不可避免。

另外,在訓(xùn)練數(shù)據(jù)上,特斯拉同樣遇到了瓶頸。按照阿肖克介紹,基于龐大的用戶群體,特斯拉每天可接收相當(dāng)于500年駕駛時(shí)長的數(shù)據(jù),這個(gè)數(shù)據(jù)量放到行業(yè)中看確實(shí)令人艷羨,但其中大多數(shù)數(shù)據(jù)卻都屬于簡單和常規(guī)場景。

換句話說,特斯拉正像中國玩家們一樣,缺少真實(shí)的高質(zhì)量數(shù)據(jù)來“喂養(yǎng)”算法。畢竟訓(xùn)練所需的高質(zhì)量難例數(shù)據(jù)可遇不可求,地平線CEO余凱由此才會(huì)說出那句“在AI時(shí)代,99%的人類數(shù)據(jù)是不值得學(xué)習(xí)的”。

特斯拉這次技術(shù)分享的重頭戲,正是他們對(duì)于以上問題提出的解法。

針對(duì)特斯拉最新的端到端架構(gòu),阿肖克表示“并不是徹頭徹尾的‘黑箱’系統(tǒng)”。從他的介紹看,現(xiàn)在的端到端架構(gòu)在輸出決策規(guī)劃信號(hào)之前,還輸出了很多中間結(jié)果,包括OCC占用網(wǎng)絡(luò)和3D高斯特征為主的場景重建視覺信息,來展現(xiàn)對(duì)于環(huán)境的感知細(xì)節(jié)。

除此之外,特斯拉還引入了思維鏈COT(Chain-of-Thought),訓(xùn)練算法用自然語言來解釋自己的行為,并給出下一步的行動(dòng)軌跡。這些中間結(jié)果,不僅可用于SR界面的渲染呈現(xiàn),同時(shí)也能用于研發(fā)校驗(yàn)和調(diào)優(yōu),來保證模型輸出的正確性。

特斯拉具備可解釋輸出模型,圖源Tesla AI

理想車主們對(duì)于以上描述應(yīng)該非常熟悉,因?yàn)槭撬麄冊(cè)谇芭牌聊簧辖?jīng)??吹降穆窂揭?guī)劃和思維過程的畫面。這就是VLA模型中的“L”(Language)部分,再加上V(Vision)的2D、3D信息,以及MoE、Diffusion模型和A(Action)的部分,就組成了VLA模型。

目前,除了理想之外,小鵬、元戎啟行和千里科技(千里浩瀚9H方案)等品牌,也都采用了VLA架構(gòu)來打造自身的智駕系統(tǒng)或者方案,讓自身的智駕功能不僅適于與用戶交互,同時(shí)也能讓智駕行為更像人。

對(duì)于特斯拉來說,目標(biāo)是一致的,但他們同時(shí)還在致力于打造一個(gè)算法評(píng)價(jià)模型。

以阿肖克的介紹來看,他們已經(jīng)基于龐大的真實(shí)用戶數(shù)據(jù),在云端打造了一個(gè)“神經(jīng)世界模擬器”(neural world simulator)。

它的用途有三個(gè),利用閉環(huán)仿真驗(yàn)證端到端指令的正確性、利用場景編輯生成能力生成對(duì)抗樣本檢驗(yàn)?zāi)P湍芰屠媚M器在閉環(huán)仿真系統(tǒng)中獲取人駕真值。

翻譯一下,就是基于真實(shí)用戶駕駛視頻數(shù)據(jù),一邊來生成在現(xiàn)實(shí)世界難獲取的難例(Corner cases)數(shù)據(jù),從而在云端訓(xùn)練和迭代智駕算法模型;另一邊,把訓(xùn)練好的算法模型放到生成好的世界模型中進(jìn)行仿真權(quán)重評(píng)價(jià)測試,針對(duì)性通過強(qiáng)化學(xué)習(xí)來增強(qiáng)模型能力。

就像是特斯拉為FSD在云端打造了一個(gè)閉環(huán)的“駕?!焙汀翱紙鰣龅亍薄O啾扔诂F(xiàn)實(shí)世界中高質(zhì)量數(shù)據(jù)的難獲得,在神經(jīng)世界模擬器中就可以讓算法訓(xùn)練和評(píng)價(jià)實(shí)現(xiàn)窮盡。

特斯拉閉環(huán)模擬神經(jīng)網(wǎng)絡(luò)模型,圖源Tesla AI

實(shí)際上,像這樣的云端世界模型,并不是特斯拉首創(chuàng),而是像理想、小鵬、零跑、華為乾崑和商湯絕影等國內(nèi)玩家已經(jīng)早已布局。

這其中,以華為乾崑為代表的玩家們,在打造云端世界模型的同時(shí),還在車端部署了世界模型,就像華為乾崑的車端世界行為模型WA,是基于視覺、聽覺和觸覺等感知數(shù)據(jù),經(jīng)過Token化后訓(xùn)練出的原生基模型。

由此,在國內(nèi)智駕行業(yè)中就有了端到端、VLA和世界模型的三種技術(shù)路線之爭,但從以上分析來看,特斯拉的最新智駕方案有可能把端到端、VLA模型和世界模型三者都涵蓋了。

特斯拉他們會(huì)這樣選擇,并不是只為了“集百家之長”這樣簡單,因?yàn)樵陲w說智行看來,端到端、VLA和世界模型并不是簡單的非此即彼競爭關(guān)系,而是端到端為基礎(chǔ)、VLA和世界模型是升級(jí)的動(dòng)態(tài)融合演進(jìn)關(guān)系。

例如上述主流玩家們無論在車端部署端到端還是VLA模型,亦或者是世界模型,都需要在云端建立一個(gè)參數(shù)量更大的世界模型進(jìn)行仿真生成訓(xùn)練和評(píng)價(jià),并且還有一些玩家車端的模型,就是云端世界模型通過修剪和蒸餾所得。由此,何小鵬、李想和余承東等大佬此前都對(duì)世界模型給予了肯定的評(píng)價(jià)。

除此之外,特斯拉布局VLA和世界模型的目的,還想去支持機(jī)器人業(yè)務(wù)的發(fā)展。

按照阿肖克表示,特斯拉閉環(huán)仿真引擎同樣可以遷移到機(jī)器人領(lǐng)域,而機(jī)器人Optimus和自動(dòng)駕駛FSD技術(shù)棧的統(tǒng)一,也為后續(xù)Cross Embodiment(跨實(shí)體具身)帶來的更泛化的具身AI發(fā)展帶來巨大的想象空間。

圖源特斯拉官微

相比之下,理想和小鵬兩家車企布局VLA和世界模型的時(shí)間更早,并且都已喊出了“要成為AI企業(yè)”的目標(biāo),他們應(yīng)該和特斯拉有著同樣的規(guī)劃。

只不過,相比于之前舉辦AI Day的特斯拉,現(xiàn)在的特斯拉已經(jīng)掉下神壇,與理想、小鵬、華為乾崑和地平線等國內(nèi)玩家們站到了一起。

根據(jù)飛說智行觀察,這次特斯拉分享技術(shù)進(jìn)展后,與之前AI Day后朋友圈刷屏的熱度相比冷清了許多,由此也能看出大家對(duì)于特斯拉在干什么,確實(shí)沒有之前那么關(guān)注了。

畢竟除了技術(shù)進(jìn)展之外,特斯拉在其他方面的成績也不夠亮眼。

02 謊言、質(zhì)疑和不愛用,特斯拉FSD未來駛向何處?

都2025年了,馬斯克依舊在為自動(dòng)駕駛“畫餅”。

在最近的第三季度財(cái)報(bào)會(huì)上,馬斯克表示特斯拉有望在今年年底前在8到10個(gè)新的州展開Robotaxi運(yùn)營,其中就包括內(nèi)華達(dá)州、佛羅里達(dá)州和亞利桑那州等對(duì)自動(dòng)駕駛技術(shù)政策寬松的大州。

而在上個(gè)季度的財(cái)報(bào)會(huì)上,馬斯克曾表示,特斯拉會(huì)在今年底前讓Robotaxi覆蓋美國50%的人口,并預(yù)計(jì)到今年底,特斯拉車主將能通過軟件更新,使自己的車輛具備無需監(jiān)督的全自動(dòng)駕駛能力(L5)。

對(duì)于馬斯克這樣的“畫餅”,大家早已司空見慣,畢竟從2016年開始,馬斯克就開始鼓吹自家FSD可以盡早實(shí)現(xiàn)全自動(dòng)駕駛的目標(biāo),但每到兌現(xiàn)期限無一例外跳票。

正因這樣,曾負(fù)責(zé)特斯拉自動(dòng)駕駛業(yè)務(wù)的前高管們看不下去了。

特斯拉前人工智能主管安德烈·卡帕西(Andrej Karpathy)最近在一檔播客中表示特斯拉自動(dòng)駕駛的問題遠(yuǎn)未得到解決,據(jù)了解他曾在2017-2022年領(lǐng)導(dǎo)特斯拉自動(dòng)駕駛項(xiàng)目。

在安德烈看來,自動(dòng)駕駛的迭代好比是無限接近100%的過程,在此之前就是無數(shù)個(gè)9的積累過程,按照他對(duì)Electrek回憶道,他曾領(lǐng)導(dǎo)特斯拉自動(dòng)駕駛經(jīng)歷了兩到三個(gè)“9”的迭代,確實(shí)顯著減少了駕駛員接管的干預(yù),但此后這樣的進(jìn)步就不明顯了。

特斯拉無接管駕駛干預(yù)百分比,圖源Electrek

安德烈之前,斯特林·安德森被行業(yè)公認(rèn)為是特斯拉自動(dòng)駕駛項(xiàng)目的首任負(fù)責(zé)人,因?yàn)樗?015-2016年領(lǐng)導(dǎo)特斯拉Autopilot發(fā)展,目前他已是通用汽車全球產(chǎn)品部門的負(fù)責(zé)人。

在近期通用汽車的活動(dòng)中,斯特林對(duì)特斯拉自動(dòng)駕駛的發(fā)展同樣進(jìn)行了質(zhì)疑,“通用Super Cruise系統(tǒng)已實(shí)現(xiàn)約11億公里的無接管行駛,且沒有發(fā)生一起由于技術(shù)導(dǎo)致的事故。但特斯拉的自動(dòng)駕駛系統(tǒng),卻無法達(dá)到這樣的安全記錄?!?/p>

在此背景下,目前特斯拉在奧斯汀和舊金山運(yùn)營的Robotaxi車輛均配備安全員,以便作為系統(tǒng)失效或錯(cuò)誤時(shí)的安全兜底。其中,奧斯汀區(qū)域的Robotaxi,安全員是坐在副駕位置;而在舊金山,安全員則是坐在主駕。

根據(jù)馬斯克的規(guī)劃,會(huì)在今年底前去掉奧斯汀大部分的安全員配置,未來幾個(gè)月內(nèi),預(yù)期至少在奧斯汀的部分區(qū)域?qū)崿F(xiàn)完全無安全駕駛員運(yùn)營。為此,馬斯克給出的解釋是“這些人類監(jiān)控員的存在并非因?yàn)楣炯夹g(shù)存在缺陷,而是出于對(duì)安全的‘高度謹(jǐn)慎’”。

不過,先不說與特斯拉同場競技的Waymo已經(jīng)實(shí)現(xiàn)了無安全員的商業(yè)化運(yùn)營,小馬智行、文遠(yuǎn)知行和蘿卜快跑等中國玩家們,則是更早就實(shí)現(xiàn)了Robotaxi無安全員的常態(tài)化運(yùn)營。

Robotaxi沒有按照馬斯克所期望的速度發(fā)展的同時(shí),特斯拉的智能輔助駕駛業(yè)務(wù)發(fā)展同樣受阻。

特斯拉第三季度財(cái)報(bào)會(huì)上,特斯拉首席財(cái)務(wù)官瓦伊巴夫?塔內(nèi)賈(Vaibhav Taneja)公開承認(rèn),上一季度FSD相關(guān)的收入較2024年同期有所下滑,具體原因是“目前付費(fèi)使用FSD的客戶總量仍然很小,僅占現(xiàn)有車隊(duì)的約12%”。

特斯拉FSD,圖源特斯拉官微

今年特斯拉對(duì)于FSD在美國市場的售價(jià)雖然進(jìn)行了調(diào)價(jià),買斷價(jià)從之前的12000美元(約合85350元人民幣)降至8000美元(約合56900元人民幣),并推出了99美元的月度訂閱服務(wù)。

但結(jié)果是,不僅沒有促進(jìn)用戶們對(duì)于FSD的購買和訂閱,反而FSD成為消費(fèi)者們不購買特斯拉的主要原因。

根據(jù)Slingshot Strategies在今年8月發(fā)布的《2025年8月電動(dòng)汽車情報(bào)報(bào)告》,他們對(duì)8000多名美國消費(fèi)者進(jìn)行調(diào)研后發(fā)現(xiàn),有將近35%的受訪者認(rèn)為“FSD功能讓他們更不愿意購買特斯拉”,因?yàn)樗麄儗?duì)FSD技術(shù)不成熟,責(zé)任界定模糊和純視覺方案可靠性不足等方面有所擔(dān)憂。

這些消費(fèi)者的擔(dān)憂并不是沒有道理。本月9日,美國國家公路交通安全管理局(NHTSA)宣布對(duì)約288萬輛配備FSD的特斯拉汽車展開調(diào)查,起因是收到58起交通安全違規(guī)及事故報(bào)告,涉及闖紅燈、逆行、車道識(shí)別錯(cuò)誤等問題。

其中就包括當(dāng)特斯拉車輛開啟FSD之后,在路口與其他車輛相撞以及誤駛向?qū)ο蜍嚨琅c別車相撞,導(dǎo)致多名人員受傷等多起事故。

03 后記

特斯拉對(duì)于全球自動(dòng)駕駛行業(yè)來說,有著重要的價(jià)值。

基于特斯拉前些年相繼提出BEV+Transformer、OCC占用網(wǎng)絡(luò)以及端到端模型,不可否認(rèn)在一定程度上給于中國玩家們很多啟發(fā),由此推動(dòng)了整個(gè)行業(yè)向前快速發(fā)展。

兩年前,或許因?yàn)椤皳?dān)心中國車企玩家們的模仿”傳言,馬斯克和特斯拉選擇了“閉麥”,AI Day就此停辦不再對(duì)外分享自動(dòng)駕駛相關(guān)技術(shù)進(jìn)展。

再到兩年后的今天,理想、小鵬、吉利、華為乾崑、地平線和Momenta等玩家雖然在技術(shù)路線上已有“三足鼎立”之勢,但馬斯克應(yīng)該也看到了一個(gè)事實(shí):特斯拉已不是行業(yè)的“標(biāo)準(zhǔn)答案”,大家都在按照自己認(rèn)定的方向向自動(dòng)駕駛終局進(jìn)行探索。

畢竟,自動(dòng)駕駛行業(yè)從不缺少“神話”,而馬斯克和特斯拉現(xiàn)在則需要更腳踏實(shí)地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。