掃一掃下載界面新聞APP

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

合成數(shù)據(jù)已成AI“無限燃料”。

明晰野望 ·

文 | 明晰野望洛蘇

2026年，AI二創(chuàng)的刷屏讓“想看什么自己做”成了常態(tài)。從照片里靜態(tài)物象開口說話，到輸入幾句提示詞就能生成拜年短片，從造內(nèi)容、造畫面到造人設，AI在C端市場展現(xiàn)出了驚人的娛樂爆發(fā)力。

當大眾的視線還停留在這些光怪陸離的“數(shù)字玩具”上時，不久前黃仁勛提出，物理AI將是人工智能的下一個浪潮。這意味著，AI接下來需要的訓練數(shù)據(jù)，需要嚴格遵循物理規(guī)律、無限接近真實世界。

從機器人疊衣服，到自動駕駛、低空經(jīng)濟飛行器、手術機器人，擁有萬億級市場規(guī)模的實體行業(yè)，都需要物理AI的加速。而AI合成數(shù)據(jù)，就是讓物理AI賦能千行百業(yè)的最后一塊拼圖?！疤摂M即真實”的邏輯，正在重構AI訓練、制造、風控、研發(fā)的全鏈路。

這不是一個停留在實驗室的學術概念，而是一場已經(jīng)爆發(fā)、有望引發(fā)新一輪產(chǎn)業(yè)革命的超級颶風。

01 合成數(shù)據(jù)，成AI“無限燃料”

理解合成數(shù)據(jù)的萬億價值，首先要看懂AI產(chǎn)業(yè)所面臨的“糧食危機”，對當下不少垂直產(chǎn)業(yè)來說，真實數(shù)據(jù)的獲取難度堪稱地獄級。

汽車行業(yè)自動駕駛技術的成長一路伴隨著全方位考驗，其本質(zhì)上是AI系統(tǒng)認知現(xiàn)實世界能力的進化。在過去，車企要達成迭代就必須組建龐大的測試車隊在全球各地日復一日地進行道路信息采集。

在此基礎上，真正決定自動駕駛安全上限的，是發(fā)生概率極低但后果極其嚴重的“長尾場景”。例如，前車連環(huán)追尾、天氣引發(fā)的側(cè)滑，或者違章行人的突然“鬼探頭”等。而為了在現(xiàn)實中測試極端場景下智能駕駛的反應能力，車企需要投入難以估量的成本去復現(xiàn)危機四伏的罕見路況。

以自動駕駛的緊急制動測試為例，為捕捉“暴雨夜間+積水反光+對向遠光燈直射+黑衣行人橫穿”等情景下的真實數(shù)據(jù)，車企不僅要在封閉測試場耗費巨資，還只能一天采集幾十組有效數(shù)據(jù)，測試和折損成本耗費極高。

在2025年的世界智能網(wǎng)聯(lián)汽車大會上，雷軍就曾表示小米在組合輔助駕駛方面的第一期總投入就達到了57.9億元，其智能駕駛團隊的規(guī)模更是超過了1800人，可謂是觸及了經(jīng)濟與效率的天花板。

在醫(yī)療這樣高度敏感且封閉的行業(yè)中，困境則來源于互聯(lián)網(wǎng)數(shù)據(jù)工具的失效。

在早期，訓練高精度的癌癥識別AI需要龐大且高質(zhì)量的患者電子病歷和多模態(tài)影像，但將患者信息輸入給大模型也存在著隱私泄露風險。美國的AI醫(yī)療公司Confidant Health就曾因服務器配置不當，導致5.3TB心理患者的個人信息和就醫(yī)記錄等隱私數(shù)據(jù)泄露。

面對患者隱私泄露等影響頗深的風險，醫(yī)院逐漸收緊對數(shù)據(jù)的管控。

全球醫(yī)療系統(tǒng)每年產(chǎn)生驚人的數(shù)據(jù)量，但因隱私紅線和機構壁壘，其中大部分被深鎖在醫(yī)院的數(shù)據(jù)高墻內(nèi)，導致頂尖AI企業(yè)空有強大的算法卻“難為無米之炊”，缺乏核心的臨床數(shù)據(jù)、病理數(shù)據(jù)喂養(yǎng)，AI在醫(yī)療領域的賦能步履維艱。

在金融領域，對客戶個人信息、投資數(shù)據(jù)和貸款風險的評估要經(jīng)歷漫長的過程。以單一銀行的風控AI來看，許多交易都是“正常的本地交易”，難以對客戶形成宏觀上的快速評估，因此反欺詐和黑產(chǎn)對抗高度依賴跨機構的交易數(shù)據(jù)。

但銀行受限于金融監(jiān)管和商業(yè)機密、無法共享真實客戶信息，風控AI模型就只能在局部的數(shù)據(jù)里打轉(zhuǎn)，難以應對全局性的金融犯罪。

垂直行業(yè)出于各類因素陷入困境時，合成數(shù)據(jù)的出現(xiàn)如同天降甘霖，它并非隨機生成的“無意義噪聲”或簡單拼接的假數(shù)據(jù)，而是通過深度學習，在分析了真實數(shù)據(jù)底層分布規(guī)律后生成的“統(tǒng)計鏡像”。

一方面，合成數(shù)據(jù)擁有真實數(shù)據(jù)的所有統(tǒng)計特性和業(yè)務邏輯，模型用它訓練的效果與真實數(shù)據(jù)高度一致，甚至能抹平原始數(shù)據(jù)中的雜音；另一方面，它從源頭切斷了與真實自然人的關聯(lián)，完美繞過嚴苛的數(shù)據(jù)隱私法規(guī)，讓醫(yī)療、金融等曾經(jīng)不敢碰的“禁區(qū)數(shù)據(jù)”變得唾手可得。

且在虛擬引擎中，批量生成的特定數(shù)據(jù)相較于現(xiàn)實世界的物理采集，成本呈指數(shù)級下降。AI初創(chuàng)公司W(wǎng)riter的Palmyra X 004模型幾乎完全依賴高質(zhì)量的合成數(shù)據(jù)進行預訓練和微調(diào)，其最終在多項企業(yè)級邏輯基準測試中名列前茅，但研發(fā)和訓練成本僅為傳統(tǒng)途徑的幾十分之一。

可以說，合成數(shù)據(jù)已經(jīng)遠遠超越了“數(shù)據(jù)平替”的范疇，它賦予了企業(yè)在數(shù)字空間中無限試錯的特權，當千行百業(yè)的AI模型不再受制于真實數(shù)據(jù)、而是坐擁取之不盡的定制化“數(shù)據(jù)糧倉”時，產(chǎn)業(yè)的進化邏輯也將迎來重寫。

02 硬核落地：“假”數(shù)據(jù)，真超車

目前，合成數(shù)據(jù)的應用不再是某種方向驗證，而是化作真金白銀的商業(yè)價值，那些率先在“虛擬世界”中囤積數(shù)據(jù)的企業(yè)，開始在現(xiàn)實競爭中以成果對傳統(tǒng)模式進行降維打擊。

2024年，西門子以106億美元巨資收購工業(yè)仿真軟件龍頭 Altair Engineering，就是為發(fā)展合成數(shù)據(jù)生成引擎而下的一盤大棋。當下，自動駕駛、高端制造、金融風控與醫(yī)藥研發(fā)這四大核心賽道，也迎來了硬核的技術落地。

不久前，小鵬汽車發(fā)布第二代VLA大模型，其訓練所吞吐的近1億段視頻片段中，絕大多數(shù)是在虛擬世界中推演生成的，龐大的數(shù)據(jù)量等效于人類司機連續(xù)駕駛65000年所能遇到的極限場景總和，讓該模型在夜間暴雨場景下的目標識別準確率提升至98.7%。

對高端制造領域來說，AI的落地長期受困于對人工經(jīng)驗的依賴，以寶鋼股份等龍頭企業(yè)為例，過去高爐的火候控制、特種鋼材的工藝參數(shù)保持等極度依賴“老師傅”，當工人水平不統(tǒng)一時，就容易出現(xiàn)爐溫波動、能耗變高和產(chǎn)品穩(wěn)定性差等問題。

2024年，寶鋼股份與華為合作，以盤古大模型為基礎開發(fā)了全球首個高爐專用大模型，進行大量合成數(shù)據(jù)的訓練。截至2025年，寶鋼股份已上線近300個AI應用場景，能夠?qū)崿F(xiàn)對內(nèi)部狀態(tài)的高精度、高時效性感知，爐溫等關鍵指標的預測準確率也達到90%。

近期，索辰科技在世界物理AI模型發(fā)布會上，展示了反無定位系統(tǒng)、風場電磁低空一體化系統(tǒng)等關鍵技術。在演示中，僅用數(shù)小時便完成流體風扇的設計、仿真與定型，并且在噪音控制、運行效率、能耗水平等核心技術指標上完成對于行業(yè)內(nèi)優(yōu)秀公司產(chǎn)品的對標。

通過消化這些合成數(shù)據(jù)，高端制造業(yè)迅速跨越了漫長的經(jīng)驗積累期，不僅能提前預判設備的非計劃停機，大幅降低維修損耗，還讓復雜工藝參數(shù)的調(diào)優(yōu)實現(xiàn)了自動化。對于大型制造企業(yè)而言，良品率哪怕僅僅提升0.1%，其背后代表的也是千萬級人民幣的凈利潤增量。

金融行業(yè)對數(shù)據(jù)的渴求與合規(guī)的忌憚同樣強烈，華興銀行與騰訊混元大模型的合作為行業(yè)提供了經(jīng)典范本。

金融機構在對公業(yè)務的盡職調(diào)查、信貸審批以及保險的核保環(huán)節(jié)，需要處理龐雜且高度敏感的客戶資產(chǎn)與經(jīng)營數(shù)據(jù)，通過引入合成數(shù)據(jù)技術，它可以生成龐大的“虛擬客戶群體”，擁有與真實客戶極其相似的信用特征、交易習慣和違約概率，但卻不包含任何真實的敏感信息。

經(jīng)過訓練，混元大模型幫助華興銀行將貸款盡調(diào)報告生成時間從10天壓縮至1小時，在無需觸碰真實客戶紅線的前提下，風控業(yè)務的自動化審核效率直接翻倍，合規(guī)測試和外部數(shù)據(jù)采購的綜合成本也降低近七成。

創(chuàng)新藥研發(fā)領域耗時十年、耗資十億美元的“雙十”鐵律，是行業(yè)數(shù)十年難以突破的成本瓶頸。根據(jù)2020年Evaluate Pharma的統(tǒng)計顯示，其中腫瘤藥的研發(fā)成本通常高達26億美元、周期長達13年。

去年，禮來和英偉達成為這條艱難賽道上的破冰者，它們在最耗時耗力的靶點發(fā)現(xiàn)和分子篩選階段，用AI在計算機中合成了數(shù)以億計的“虛擬分子結構”，極大提升靶點識別的效率，將傳統(tǒng)藥物研發(fā)周期縮短至2-3年、失敗率降低50％。

這種模式下，AI不僅完美避開了醫(yī)學倫理困境，為絕癥患者搶奪了最寶貴的救命時間、也為藥企省下了數(shù)以億計的研發(fā)資金。1月12日，禮來和英偉達共同宣布投資10億美元建立人工智能藥物實驗室，正是因為它們看到了合成數(shù)據(jù)在醫(yī)藥研發(fā)中的終極潛力。

隨著合成數(shù)據(jù)的持續(xù)爆發(fā)，數(shù)據(jù)銀行這一全新業(yè)態(tài)或許也即將成型，企業(yè)不再需要冒著高成本與高風險獲取真實數(shù)據(jù)，僅需在“數(shù)據(jù)銀行”購買由權威機構認證、帶有隱式合規(guī)水印的“定制化合成數(shù)據(jù)集”，就能高性價比地完成絕大部分訓練。

到那時“假戲真做”將不再是大眾的娛樂調(diào)侃，而是千行百業(yè)加速進化的絕對生產(chǎn)力。

本文為轉(zhuǎn)載內(nèi)容，授權事宜請聯(lián)系原著作權人。

人工智能產(chǎn)業(yè)觀察

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

合成數(shù)據(jù)已成AI“無限燃料”。

明晰野望 · 2026/03/30 10:42

文 | 明晰野望洛蘇

這不是一個停留在實驗室的學術概念，而是一場已經(jīng)爆發(fā)、有望引發(fā)新一輪產(chǎn)業(yè)革命的超級颶風。

01 合成數(shù)據(jù)，成AI“無限燃料”

在醫(yī)療這樣高度敏感且封閉的行業(yè)中，困境則來源于互聯(lián)網(wǎng)數(shù)據(jù)工具的失效。

面對患者隱私泄露等影響頗深的風險，醫(yī)院逐漸收緊對數(shù)據(jù)的管控。

02 硬核落地：“假”數(shù)據(jù)，真超車

金融行業(yè)對數(shù)據(jù)的渴求與合規(guī)的忌憚同樣強烈，華興銀行與騰訊混元大模型的合作為行業(yè)提供了經(jīng)典范本。

到那時“假戲真做”將不再是大眾的娛樂調(diào)侃，而是千行百業(yè)加速進化的絕對生產(chǎn)力。

本文為轉(zhuǎn)載內(nèi)容，授權事宜請聯(lián)系原著作權人。

歷史搜索全部刪除

熱門搜索

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

01 合成數(shù)據(jù)，成AI“無限燃料”

02 硬核落地：“假”數(shù)據(jù)，真超車

評論

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

01 合成數(shù)據(jù)，成AI“無限燃料”

02 硬核落地：“假”數(shù)據(jù)，真超車

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

01 合成數(shù)據(jù)，成AI“無限燃料”

02 硬核落地：“假”數(shù)據(jù)，真超車

評論

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

01 合成數(shù)據(jù)，成AI“無限燃料”

02 硬核落地：“假”數(shù)據(jù)，真超車

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

01 合成數(shù)據(jù)，成AI“無限燃料”

02 硬核落地：“假”數(shù)據(jù)，真超車

物理AI的超級颶風，讓“假”數(shù)據(jù)迎來真超車

01 合成數(shù)據(jù)，成AI“無限燃料”

02 硬核落地：“假”數(shù)據(jù)，真超車