掃一掃下載界面新聞APP

人工智能行至中場，“物理AI”成關(guān)鍵賽點

關(guān)乎未來，也關(guān)乎你我。

極智GeeTech ·

文｜極智GeeTech

沒人知道人工智能的終局是什么，但科技巨頭都在瘋狂下注。

2025年秋，“物理AI”走到人工智能舞臺中央，成為全球科技企業(yè)競相角逐的焦點。

當(dāng)英偉達(dá)站在5萬億美元市值的門口，物理AI成為了那塊敲門磚。在今年GTC大會上，黃仁勛系統(tǒng)闡述了物理AI技術(shù)戰(zhàn)略，同時公布量子計算、6G網(wǎng)絡(luò)等前沿領(lǐng)域的重大布局。

在主題為“涌現(xiàn)Emergence”的2025小鵬科技日上，小鵬汽車勾勒出物理AI在未來出行的清晰圖景，并且圍繞物理AI發(fā)布了第二代VLA、Robotaxi、全新一代人形機器人IRON，以及小鵬匯天飛行體系四項重要應(yīng)用。

一場席卷全球的物理AI競賽已全面打響，從硅谷到中國，科技巨頭們正以千億級投入爭奪下一個技術(shù)時代的話語權(quán)。

物理AI落地三大關(guān)鍵環(huán)節(jié)

2020年，瑞士聯(lián)邦材料科學(xué)與技術(shù)實驗室Aslan Miriyev與倫敦帝國理工學(xué)院Mirko Kovac在《Nature Machine Intelligence》首次提出“物理AI”概念，強調(diào)機體、控制、感知等要素的協(xié)同演進(jìn)。

2024年，英偉達(dá)首席執(zhí)行官黃仁勛將其視為AI發(fā)展的核心方向，提出通過感知、推理和行動鏈實現(xiàn)物理交互能力。

物理AI將人工智能從“數(shù)字理解”推向“物理交互”的維度跨越，已成為衡量科技企業(yè)核心競爭力的新標(biāo)尺，其落地依賴三大關(guān)鍵環(huán)節(jié)：虛擬環(huán)境的物理建模與訓(xùn)練、高質(zhì)量物理數(shù)據(jù)的生成與推理、真實場景的感知與決策閉環(huán)。

虛擬建模是物理AI的基礎(chǔ)，其核心是通過融合經(jīng)典物理定律與深度學(xué)習(xí)，構(gòu)建與真實世界高度一致的仿真環(huán)境，主要通過生成式物理引擎和強化學(xué)習(xí)技術(shù)實現(xiàn)，結(jié)合神經(jīng)網(wǎng)絡(luò)模擬物理規(guī)律并生成訓(xùn)練數(shù)據(jù)。

生成式物理引擎融合經(jīng)典物理定律（力學(xué)、熱力學(xué)等）與深度學(xué)習(xí)，構(gòu)建多物理場耦合的仿真系統(tǒng)，支持剛體、流體、電磁等多場景的動態(tài)模擬，這其中需要平衡仿真精度與實時性，同時具備可擴展性，能適配不同復(fù)雜度的物理場景（從簡單運動到復(fù)雜材料交互）。高精度建模與實時計算存在天然矛盾，需通過算法優(yōu)化（如分層積分、動態(tài)阻尼調(diào)整）縮小差距。

物理AI的性能依賴于高質(zhì)量數(shù)據(jù)的支撐，而“合成數(shù)據(jù)+真實數(shù)據(jù)”的虛實融合模式，解決了真實物理數(shù)據(jù)稀缺、標(biāo)注困難的痛點。高質(zhì)量數(shù)據(jù)的生成與推理主要依賴于物理建模、數(shù)據(jù)采集技術(shù)和生成模型的結(jié)合，通過真實數(shù)據(jù)采集、物理約束優(yōu)化和算法生成等方式實現(xiàn)。

該環(huán)節(jié)通過物理引擎生成合成數(shù)據(jù)，并結(jié)合生成式AI擴展數(shù)據(jù)多樣性；推理階段需要嵌入物理約束，實現(xiàn)對物體運動、交互關(guān)系的預(yù)測與歸因。其中，數(shù)據(jù)需要滿足“物理真實性”（符合客觀規(guī)律）與 “分布全面性”（覆蓋極端場景與邊界條件）要求，推理過程需具備可解釋性，而非純黑盒預(yù)測。挑戰(zhàn)在于合成數(shù)據(jù)與真實數(shù)據(jù)存在域差距，需通過數(shù)據(jù)增強、虛實融合技術(shù)縮小差異，同時物理數(shù)據(jù)的高效推理對算力與算法架構(gòu)提出了更高要求。

物理AI的最終價值在于落地真實場景，真實場景中的感知與決策閉環(huán)主要依賴于多模態(tài)數(shù)據(jù)融合、端到端模型架構(gòu)和實時算力支持，通過感知環(huán)境、理解意圖、快速決策和精準(zhǔn)執(zhí)行實現(xiàn)閉環(huán)。

該環(huán)節(jié)將虛擬訓(xùn)練的模型與真實物理世界對接，完成“感知-決策-執(zhí)行-反饋”的閉環(huán)迭代，讓AI適配真實環(huán)境的不確定性。多傳感器融合（視覺、力控、慣性測量等）實現(xiàn)環(huán)境與物體狀態(tài)的精準(zhǔn)感知；決策算法需結(jié)合模型預(yù)測控制與強化學(xué)習(xí)，兼顧實時性與魯棒性。而真實環(huán)境的復(fù)雜性（非結(jié)構(gòu)化、動態(tài)變化）遠(yuǎn)超虛擬場景，需要解決模型泛化能力不足的問題，同時端側(cè)部署需要進(jìn)一步平衡推理速度、精度與硬件功耗。

海外科技巨頭的戰(zhàn)略卡位

當(dāng)物理AI已成為人工智能領(lǐng)域下一個關(guān)鍵賽點，全球科技巨頭憑借各自優(yōu)勢，形成了特色鮮明的發(fā)展路徑。

在巴塞羅那智慧城市博覽會世界大會上，英偉達(dá)集中展示物理AI應(yīng)用成果，其整合Omniverse、Cosmos和Metropolis等平臺，不僅能模擬真實世界環(huán)境，還能生成合成數(shù)據(jù)、訓(xùn)練視覺語言模型（VLM），并通過AI代理分析城市視頻流，形成一個從數(shù)據(jù)到?jīng)Q策的完整生態(tài)閉環(huán)。

針對真實場景訓(xùn)練成本高、風(fēng)險大（如機器人高危作業(yè)測試、飛行器氣動實驗）的痛點，Omniverse通過“高精度物理建模+數(shù)字孿生”提供解決方案，不僅可以模擬重力、摩擦力、流體力學(xué)等多物理場效應(yīng)，還能支持機器人硬件設(shè)計與算法驗證的虛擬化，縮短原型迭代周期。

物理AI面臨的第二個痛點是數(shù)據(jù)枯竭危機，需要附帶物理屬性的高質(zhì)量數(shù)據(jù)，Cosmos通過“生成式建模+物理推理”雙重能力突破瓶頸，其通過文本、圖像輸入生成物理逼真的視頻數(shù)據(jù)，解決了傳統(tǒng)VLM無法處理多步驟物理任務(wù)的缺陷，可以基于先驗知識預(yù)判物理變化，自主推理下一步驟或動作。

在動態(tài)現(xiàn)實場景中，物理AI需要低延遲感知和實時決策（如自動駕駛避障、智慧城市交通調(diào)度），Metropolis 通過“邊緣視覺分析+算力協(xié)同”構(gòu)建感知底座，既可以通過感知設(shè)備進(jìn)行多模態(tài)物理動態(tài)捕捉，還能在邊緣端進(jìn)行實時推理加速秒，滿足物理AI毫秒級動作生成需求。

谷歌DeepMind走出了通用智能的路線。今年9月，DeepMind正式發(fā)布新一代通用機器人基座模型——Gemini Robotics 1.5系列。這一系列由兩大模型組成：Gemini Robotics 1.5（GR 1.5）負(fù)責(zé)動作執(zhí)行的多模態(tài)大模型；Gemini Robotics-ER 1.5（GR-ER 1.5）強化推理能力，提供規(guī)劃與理解支持。其中，ER代表“具身推理”。該系列模型不止于對語言、圖像進(jìn)行理解，還結(jié)合了視覺、語言與動作（VLA），并通過具身推理來實現(xiàn)“先思考，再行動”。

兩者結(jié)合，能讓機器人不僅完成折紙、解袋子這樣的單一動作，還能解決分揀深淺色衣物、根據(jù)某地天氣自動打包行李這種需要理解外部信息、分解復(fù)雜流程的多步任務(wù)。它甚至還能根據(jù)特定地點的特定要求（比如北京和上海的不同垃圾分類標(biāo)準(zhǔn)），自己上網(wǎng)搜索，以幫助人們完成垃圾分類。該模型還能夠在多種不同的機器人之間進(jìn)行能力的零樣本跨平臺遷移。

特斯拉則堅持產(chǎn)品驅(qū)動策略，Optimus二代機器人搭載自研的物理引擎，其擁有22個自由度的靈巧手能夠完成疊襯衫、在工廠分揀物品等任務(wù)，還能將千萬輛特斯拉汽車的駕駛數(shù)據(jù)轉(zhuǎn)化為物理AI訓(xùn)練素材，形成出行場景反哺機器人研發(fā)的獨特閉環(huán)。馬斯克對Optimus項目寄予厚望，他設(shè)定了一個極其激進(jìn)的目標(biāo)，計劃到今年年底便生產(chǎn)多達(dá)5000臺Optimus機器人。

今年6月，亞馬遜宣布將在其神秘的硬件研發(fā)部門Lab126內(nèi)組建一支新的Agentic AI團隊，開始物理AI的研發(fā)工作。這一決定標(biāo)志著亞馬遜正式進(jìn)軍物理AI的研發(fā)領(lǐng)域，特別是針對機器人技術(shù)的深度探索。

亞馬遜倉庫中的崗位，可能會成為首批受到物理AI影響的領(lǐng)域。近期，亞馬遜發(fā)布了一款名為“Blue Jay”的新型多功能倉庫機器人系統(tǒng)，并透露其已在美國南卡羅來納州的一處倉庫投入測試。Blue Jay整合了揀選、分類和整合包裹等多個環(huán)節(jié)，旨在將此前三個獨立的機器人工作站合而為一。

亞馬遜計劃到2027年實現(xiàn)75%倉儲物流自動化，或減少超50萬崗位招聘，節(jié)省126億美元人力成本。

除了Blue Jay，亞馬遜還推出了另外兩項技術(shù)創(chuàng)新。其中之一是名為“Project Eluna”的代理式AI系統(tǒng)，旨在為運營經(jīng)理提供決策支持。該系統(tǒng)可以整合歷史和實時數(shù)據(jù)，預(yù)測運營瓶頸并向操作員推薦解決方案。另一項創(chuàng)新是為配送司機設(shè)計的增強現(xiàn)實AR眼鏡。這款眼鏡集成了人工智能、傳感器和攝像頭，可在司機視野內(nèi)疊加路線導(dǎo)航、危險提醒（如提示客戶住處有狗）等信息，并能掃描包裹。

物理AI重塑生產(chǎn)力

這場全球競賽的背后，是物理AI重塑生產(chǎn)力格局的巨大潛能。

Gartner拋出重磅預(yù)測，到2030年，IT部門的所有工作都將與AI深度綁定，AI將徹底重塑傳統(tǒng)工作模式與人才需求格局。其中，未來五年內(nèi)，25%的IT工作將完全由機器人獨立執(zhí)行，剩余75%的工作則需人類從業(yè)者借助AI工具協(xié)同完成。

物理AI的終極價值，在于將人類從重復(fù)物理勞動中解放出來。當(dāng)Robotaxi自動完成城市通勤、機器人承擔(dān)高危作業(yè)、飛行汽車打通低空通道，人類得以專注于創(chuàng)意、研發(fā)等更高價值的活動。這種生產(chǎn)力解放帶來的將是生產(chǎn)力的巨大躍升，當(dāng)每個機器都能理解物理世界，人類將獲得前所未有的自由。

在工業(yè)領(lǐng)域，物理AI核心在于將傳統(tǒng)“剛性自動化”升級為“柔性自主化”，實現(xiàn)生產(chǎn)全流程的效率躍遷與成本優(yōu)化。其變革邏輯圍繞“數(shù)字孿生訓(xùn)練場+自主決策機器人+全鏈路協(xié)同優(yōu)化”三大支柱展開。

數(shù)字孿生技術(shù)讓工廠擺脫了物理試錯的低效模式，將工業(yè)設(shè)計、工業(yè)制造的每一個細(xì)節(jié)都能在虛擬空間完成仿真優(yōu)化，大幅縮短生產(chǎn)周期，降低產(chǎn)品投產(chǎn)初期故障率。更關(guān)鍵的是，物理仿真與AI的深度融合解決了傳統(tǒng)工業(yè)機器人不會思考的痛點，通過仿真環(huán)境，機器人可在虛擬空間完成百萬次場景訓(xùn)練——從倉儲分揀到設(shè)備檢修，從零件裝配到故障排查，無需占用真實產(chǎn)能即可形成最優(yōu)操作策略。

全鏈路協(xié)同優(yōu)化讓生產(chǎn)力提升從單點突破走向系統(tǒng)升級。通過決策優(yōu)化平臺內(nèi)置的預(yù)設(shè)算法模塊，可使生產(chǎn)計劃調(diào)整響應(yīng)時間從數(shù)小時縮短至十分鐘，綜合生產(chǎn)成本得到進(jìn)一步降低。

在交通和能源這兩大關(guān)乎國計民生的領(lǐng)域，物理AI正通過對復(fù)雜物理系統(tǒng)的精準(zhǔn)控制，同時解決效率低下與安全風(fēng)險兩大痛點，重塑行業(yè)生產(chǎn)力格局。

在自動駕駛領(lǐng)域，物理AI是從“實驗室演示”邁向“商業(yè)化落地”的關(guān)鍵，解決了真實道路的復(fù)雜性與不確定性。依托于“多傳感器融合+物理世界模型+超強算力”的架構(gòu)，自動駕駛系統(tǒng)能夠精準(zhǔn)感知路面狀況、車輛位置和行人動態(tài)，破解了傳統(tǒng)自動駕駛在極端天氣和突發(fā)狀況下感知及決策精準(zhǔn)性的難題。

物理AI將交通生產(chǎn)力從單車載運升級為集群化智能調(diào)度，通過MogoMind等物理世界多模態(tài)大模型，自動駕駛車隊可實現(xiàn)路徑動態(tài)規(guī)劃、運力實時調(diào)配，進(jìn)一步城市出行效率，降低物流運輸成本，徹底改變傳統(tǒng)交通系統(tǒng)“各自為戰(zhàn)”的低效模式。

在能源領(lǐng)域，物理AI正在推動清潔能源從“間歇性供給”轉(zhuǎn)向“穩(wěn)定化輸出”，優(yōu)化能源利用效率。物理AI可以根據(jù)實時用電負(fù)荷、新能源發(fā)電功率和輸電線路損耗數(shù)據(jù)，動態(tài)調(diào)整電力分配策略，降低電網(wǎng)損耗，提升新能源消納率。

盡管物理AI已取得顯著進(jìn)展，但要全面重塑生產(chǎn)力，仍需突破三大核心挑戰(zhàn)。

首先，物理AI與實體系統(tǒng)深度耦合，其決策失誤可能導(dǎo)致生產(chǎn)事故、醫(yī)療風(fēng)險等嚴(yán)重后果，但全球尚未形成統(tǒng)一的物理AI安全標(biāo)準(zhǔn)。

其次，仿真環(huán)境與真實世界的差異（如材質(zhì)、光照、干擾）仍會影響AI模型的泛化能力，Sim2Real遷移仍是技術(shù)難點。

其三，高端傳感器、GPU算力、定制化算法的研發(fā)成本高昂，中小企業(yè)難以負(fù)擔(dān)，導(dǎo)致技術(shù)普及速度受限。

全球科技巨頭競逐物理AI，本質(zhì)上是對下一個十年技術(shù)話語權(quán)的爭奪。物理AI不僅是人工智能的升級方向，更是衡量國家科技競爭力的核心指標(biāo)，它既決定著制造業(yè)高端化的進(jìn)程，也影響著未來出行、機器人等萬億級市場的格局。

到2030年，物理AI將全面滲透到生產(chǎn)生活的各個角落：工廠實現(xiàn)100%自主化生產(chǎn)，農(nóng)業(yè)機器人完成從播種到收割的全流程作業(yè)，自動駕駛車隊主導(dǎo)城市出行，核聚變電站提供穩(wěn)定清潔能源，AI醫(yī)生實現(xiàn)常見病的精準(zhǔn)診療。

這場關(guān)乎未來的物理AI競賽，早已超越商業(yè)層面的較量，它是數(shù)字智能向物理世界延伸的必經(jīng)之路，是人類探索智能邊界的重要一步。在這場較量中，每一次技術(shù)突破都在重塑我們與世界的交互方式，正如物理世界的規(guī)律不可逆轉(zhuǎn)，這場由物理AI引發(fā)的技術(shù)浪潮，開始續(xù)寫人工智能的下一章節(jié)。

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請聯(lián)系原著作權(quán)人。

人工智能科技