文|極智GeeTech
沒人知道人工智能的終局是什么,但科技巨頭都在瘋狂下注。
2025年秋,“物理AI”走到人工智能舞臺中央,成為全球科技企業(yè)競相角逐的焦點。
當英偉達站在5萬億美元市值的門口,物理AI成為了那塊敲門磚。在今年GTC大會上,黃仁勛系統(tǒng)闡述了物理AI技術戰(zhàn)略,同時公布量子計算、6G網絡等前沿領域的重大布局。
在主題為“涌現Emergence”的2025小鵬科技日上,小鵬汽車勾勒出物理AI在未來出行的清晰圖景,并且圍繞物理AI發(fā)布了第二代VLA、Robotaxi、全新一代人形機器人IRON,以及小鵬匯天飛行體系四項重要應用。
一場席卷全球的物理AI競賽已全面打響,從硅谷到中國,科技巨頭們正以千億級投入爭奪下一個技術時代的話語權。
物理AI落地三大關鍵環(huán)節(jié)
2020年,瑞士聯邦材料科學與技術實驗室Aslan Miriyev與倫敦帝國理工學院Mirko Kovac在《Nature Machine Intelligence》首次提出“物理AI”概念,強調機體、控制、感知等要素的協同演進。
2024年,英偉達首席執(zhí)行官黃仁勛將其視為AI發(fā)展的核心方向,提出通過感知、推理和行動鏈實現物理交互能力。
物理AI將人工智能從“數字理解”推向“物理交互”的維度跨越,已成為衡量科技企業(yè)核心競爭力的新標尺,其落地依賴三大關鍵環(huán)節(jié):虛擬環(huán)境的物理建模與訓練、高質量物理數據的生成與推理、真實場景的感知與決策閉環(huán)。

虛擬建模是物理AI的基礎,其核心是通過融合經典物理定律與深度學習,構建與真實世界高度一致的仿真環(huán)境,主要通過生成式物理引擎和強化學習技術實現,結合神經網絡模擬物理規(guī)律并生成訓練數據。
生成式物理引擎融合經典物理定律(力學、熱力學等)與深度學習,構建多物理場耦合的仿真系統(tǒng),支持剛體、流體、電磁等多場景的動態(tài)模擬,這其中需要平衡仿真精度與實時性,同時具備可擴展性,能適配不同復雜度的物理場景(從簡單運動到復雜材料交互)。高精度建模與實時計算存在天然矛盾,需通過算法優(yōu)化(如分層積分、動態(tài)阻尼調整)縮小差距。
物理AI的性能依賴于高質量數據的支撐,而“合成數據+真實數據”的虛實融合模式,解決了真實物理數據稀缺、標注困難的痛點。高質量數據的生成與推理主要依賴于物理建模、數據采集技術和生成模型的結合,通過真實數據采集、物理約束優(yōu)化和算法生成等方式實現。
該環(huán)節(jié)通過物理引擎生成合成數據,并結合生成式AI擴展數據多樣性;推理階段需要嵌入物理約束,實現對物體運動、交互關系的預測與歸因。其中,數據需要滿足“物理真實性”(符合客觀規(guī)律)與 “分布全面性”(覆蓋極端場景與邊界條件)要求,推理過程需具備可解釋性,而非純黑盒預測。挑戰(zhàn)在于合成數據與真實數據存在域差距,需通過數據增強、虛實融合技術縮小差異,同時物理數據的高效推理對算力與算法架構提出了更高要求。
物理AI的最終價值在于落地真實場景,真實場景中的感知與決策閉環(huán)主要依賴于多模態(tài)數據融合、端到端模型架構和實時算力支持,通過感知環(huán)境、理解意圖、快速決策和精準執(zhí)行實現閉環(huán)。

該環(huán)節(jié)將虛擬訓練的模型與真實物理世界對接,完成“感知-決策-執(zhí)行-反饋”的閉環(huán)迭代,讓AI適配真實環(huán)境的不確定性。多傳感器融合(視覺、力控、慣性測量等)實現環(huán)境與物體狀態(tài)的精準感知;決策算法需結合模型預測控制與強化學習,兼顧實時性與魯棒性。而真實環(huán)境的復雜性(非結構化、動態(tài)變化)遠超虛擬場景,需要解決模型泛化能力不足的問題,同時端側部署需要進一步平衡推理速度、精度與硬件功耗。
海外科技巨頭的戰(zhàn)略卡位
當物理AI已成為人工智能領域下一個關鍵賽點,全球科技巨頭憑借各自優(yōu)勢,形成了特色鮮明的發(fā)展路徑。
在巴塞羅那智慧城市博覽會世界大會上,英偉達集中展示物理AI應用成果,其整合Omniverse、Cosmos和Metropolis等平臺,不僅能模擬真實世界環(huán)境,還能生成合成數據、訓練視覺語言模型(VLM),并通過AI代理分析城市視頻流,形成一個從數據到決策的完整生態(tài)閉環(huán)。
針對真實場景訓練成本高、風險大(如機器人高危作業(yè)測試、飛行器氣動實驗)的痛點,Omniverse通過“高精度物理建模+數字孿生”提供解決方案,不僅可以模擬重力、摩擦力、流體力學等多物理場效應,還能支持機器人硬件設計與算法驗證的虛擬化,縮短原型迭代周期。
物理AI面臨的第二個痛點是數據枯竭危機,需要附帶物理屬性的高質量數據,Cosmos通過“生成式建模+物理推理”雙重能力突破瓶頸,其通過文本、圖像輸入生成物理逼真的視頻數據,解決了傳統(tǒng)VLM無法處理多步驟物理任務的缺陷,可以基于先驗知識預判物理變化,自主推理下一步驟或動作。
在動態(tài)現實場景中,物理AI需要低延遲感知和實時決策(如自動駕駛避障、智慧城市交通調度),Metropolis 通過“邊緣視覺分析+算力協同”構建感知底座,既可以通過感知設備進行多模態(tài)物理動態(tài)捕捉,還能在邊緣端進行實時推理加速秒,滿足物理AI毫秒級動作生成需求。
谷歌DeepMind走出了通用智能的路線。今年9月,DeepMind正式發(fā)布新一代通用機器人基座模型——Gemini Robotics 1.5系列。這一系列由兩大模型組成:Gemini Robotics 1.5(GR 1.5)負責動作執(zhí)行的多模態(tài)大模型;Gemini Robotics-ER 1.5(GR-ER 1.5)強化推理能力,提供規(guī)劃與理解支持。其中,ER代表“具身推理”。該系列模型不止于對語言、圖像進行理解,還結合了視覺、語言與動作(VLA),并通過具身推理來實現“先思考,再行動”。
兩者結合,能讓機器人不僅完成折紙、解袋子這樣的單一動作,還能解決分揀深淺色衣物、根據某地天氣自動打包行李這種需要理解外部信息、分解復雜流程的多步任務。它甚至還能根據特定地點的特定要求(比如北京和上海的不同垃圾分類標準),自己上網搜索,以幫助人們完成垃圾分類。該模型還能夠在多種不同的機器人之間進行能力的零樣本跨平臺遷移。
特斯拉則堅持產品驅動策略,Optimus二代機器人搭載自研的物理引擎,其擁有22個自由度的靈巧手能夠完成疊襯衫、在工廠分揀物品等任務,還能將千萬輛特斯拉汽車的駕駛數據轉化為物理AI訓練素材,形成出行場景反哺機器人研發(fā)的獨特閉環(huán)。馬斯克對Optimus項目寄予厚望,他設定了一個極其激進的目標,計劃到今年年底便生產多達5000臺Optimus機器人。
今年6月,亞馬遜宣布將在其神秘的硬件研發(fā)部門Lab126內組建一支新的Agentic AI團隊,開始物理AI的研發(fā)工作。這一決定標志著亞馬遜正式進軍物理AI的研發(fā)領域,特別是針對機器人技術的深度探索。
亞馬遜倉庫中的崗位,可能會成為首批受到物理AI影響的領域。近期,亞馬遜發(fā)布了一款名為“Blue Jay”的新型多功能倉庫機器人系統(tǒng),并透露其已在美國南卡羅來納州的一處倉庫投入測試。Blue Jay整合了揀選、分類和整合包裹等多個環(huán)節(jié),旨在將此前三個獨立的機器人工作站合而為一。
亞馬遜計劃到2027年實現75%倉儲物流自動化,或減少超50萬崗位招聘,節(jié)省126億美元人力成本。
除了Blue Jay,亞馬遜還推出了另外兩項技術創(chuàng)新。其中之一是名為“Project Eluna”的代理式AI系統(tǒng),旨在為運營經理提供決策支持。該系統(tǒng)可以整合歷史和實時數據,預測運營瓶頸并向操作員推薦解決方案。另一項創(chuàng)新是為配送司機設計的增強現實AR眼鏡。這款眼鏡集成了人工智能、傳感器和攝像頭,可在司機視野內疊加路線導航、危險提醒(如提示客戶住處有狗)等信息,并能掃描包裹。
物理AI重塑生產力
這場全球競賽的背后,是物理AI重塑生產力格局的巨大潛能。
Gartner拋出重磅預測,到2030年,IT部門的所有工作都將與AI深度綁定,AI將徹底重塑傳統(tǒng)工作模式與人才需求格局。其中,未來五年內,25%的IT工作將完全由機器人獨立執(zhí)行,剩余75%的工作則需人類從業(yè)者借助AI工具協同完成。
物理AI的終極價值,在于將人類從重復物理勞動中解放出來。當Robotaxi自動完成城市通勤、機器人承擔高危作業(yè)、飛行汽車打通低空通道,人類得以專注于創(chuàng)意、研發(fā)等更高價值的活動。這種生產力解放帶來的將是生產力的巨大躍升,當每個機器都能理解物理世界,人類將獲得前所未有的自由。
在工業(yè)領域,物理AI核心在于將傳統(tǒng)“剛性自動化”升級為“柔性自主化”,實現生產全流程的效率躍遷與成本優(yōu)化。其變革邏輯圍繞“數字孿生訓練場+自主決策機器人+全鏈路協同優(yōu)化”三大支柱展開。
數字孿生技術讓工廠擺脫了物理試錯的低效模式,將工業(yè)設計、工業(yè)制造的每一個細節(jié)都能在虛擬空間完成仿真優(yōu)化,大幅縮短生產周期,降低產品投產初期故障率。更關鍵的是,物理仿真與AI的深度融合解決了傳統(tǒng)工業(yè)機器人不會思考的痛點,通過仿真環(huán)境,機器人可在虛擬空間完成百萬次場景訓練——從倉儲分揀到設備檢修,從零件裝配到故障排查,無需占用真實產能即可形成最優(yōu)操作策略。
全鏈路協同優(yōu)化讓生產力提升從單點突破走向系統(tǒng)升級。通過決策優(yōu)化平臺內置的預設算法模塊,可使生產計劃調整響應時間從數小時縮短至十分鐘,綜合生產成本得到進一步降低。
在交通和能源這兩大關乎國計民生的領域,物理AI正通過對復雜物理系統(tǒng)的精準控制,同時解決效率低下與安全風險兩大痛點,重塑行業(yè)生產力格局。
在自動駕駛領域,物理AI是從“實驗室演示”邁向“商業(yè)化落地”的關鍵,解決了真實道路的復雜性與不確定性。依托于“多傳感器融合+物理世界模型+超強算力”的架構,自動駕駛系統(tǒng)能夠精準感知路面狀況、車輛位置和行人動態(tài),破解了傳統(tǒng)自動駕駛在極端天氣和突發(fā)狀況下感知及決策精準性的難題。

物理AI將交通生產力從單車載運升級為集群化智能調度,通過MogoMind等物理世界多模態(tài)大模型,自動駕駛車隊可實現路徑動態(tài)規(guī)劃、運力實時調配,進一步城市出行效率,降低物流運輸成本,徹底改變傳統(tǒng)交通系統(tǒng)“各自為戰(zhàn)”的低效模式。
在能源領域,物理AI正在推動清潔能源從“間歇性供給”轉向“穩(wěn)定化輸出”,優(yōu)化能源利用效率。物理AI可以根據實時用電負荷、新能源發(fā)電功率和輸電線路損耗數據,動態(tài)調整電力分配策略,降低電網損耗,提升新能源消納率。
盡管物理AI已取得顯著進展,但要全面重塑生產力,仍需突破三大核心挑戰(zhàn)。
首先,物理AI與實體系統(tǒng)深度耦合,其決策失誤可能導致生產事故、醫(yī)療風險等嚴重后果,但全球尚未形成統(tǒng)一的物理AI安全標準。
其次,仿真環(huán)境與真實世界的差異(如材質、光照、干擾)仍會影響AI模型的泛化能力,Sim2Real遷移仍是技術難點。
其三,高端傳感器、GPU算力、定制化算法的研發(fā)成本高昂,中小企業(yè)難以負擔,導致技術普及速度受限。
全球科技巨頭競逐物理AI,本質上是對下一個十年技術話語權的爭奪。物理AI不僅是人工智能的升級方向,更是衡量國家科技競爭力的核心指標,它既決定著制造業(yè)高端化的進程,也影響著未來出行、機器人等萬億級市場的格局。
到2030年,物理AI將全面滲透到生產生活的各個角落:工廠實現100%自主化生產,農業(yè)機器人完成從播種到收割的全流程作業(yè),自動駕駛車隊主導城市出行,核聚變電站提供穩(wěn)定清潔能源,AI醫(yī)生實現常見病的精準診療。
這場關乎未來的物理AI競賽,早已超越商業(yè)層面的較量,它是數字智能向物理世界延伸的必經之路,是人類探索智能邊界的重要一步。在這場較量中,每一次技術突破都在重塑我們與世界的交互方式,正如物理世界的規(guī)律不可逆轉,這場由物理AI引發(fā)的技術浪潮,開始續(xù)寫人工智能的下一章節(jié)。

