文|壹娛觀察 大娛樂家
AI視頻的戰(zhàn)爭,才剛剛開始。
在生成式AI的大航海時(shí)代,文字、圖像、代碼的疆界已相繼被重繪,唯獨(dú)“視頻”這一最復(fù)雜、最昂貴、最具傳播勢能的內(nèi)容形態(tài),始終處在被技術(shù)反復(fù)叩門卻未徹底攻陷的高地。
這個(gè)局面,似乎終于要被OpenAI在10月1日推出的Sora2而改變。
如果說今年早些時(shí)候的Sora只是一次“從文本到視頻”的早期演示,那么 Sora2則更像是一次內(nèi)容范式的重塑:它不僅能生成物理一致性更強(qiáng)、鏡頭語言更成熟的動(dòng)態(tài)畫面,還在音畫同步、環(huán)境聲效、人物對(duì)白等方面實(shí)現(xiàn)了重大突破——AI不再只是“畫面導(dǎo)演”,而是第一次同時(shí)擔(dān)任了攝影師、編劇、配樂師和演員。
與此同時(shí),OpenAI還選擇將它打包成一個(gè)社交平臺(tái)級(jí)產(chǎn)品——Sora App,而不只是模型本身:創(chuàng)作者可以一鍵生成視頻、上傳人像 cameo、Remix他人作品,甚至像刷TikTok一樣在流里發(fā)現(xiàn)AI內(nèi)容。

這也是為何,長期對(duì)視頻生成持謹(jǐn)慎態(tài)度的知名分析師Ben Thompson 態(tài)度大變,稱之為“一個(gè)可能撼動(dòng)Meta和Tiktok社交帝國根基的威脅”——Sora不再是技術(shù)的展示,而是內(nèi)容分發(fā)邏輯的重塑。
當(dāng)AI不僅能生成視頻,還能決定“視頻如何被觀看”“創(chuàng)作者如何被推薦”時(shí),整個(gè)內(nèi)容平臺(tái)的生態(tài)規(guī)則都可能被重寫。
面對(duì)這股浪潮,中國的科技巨頭們自然不會(huì)坐視不理。字節(jié)跳動(dòng)的即夢和快手的可靈作為AI文生視頻工具也已存在多時(shí),并在國內(nèi)用戶增長和產(chǎn)品功能上迅速迭代,正因如此,當(dāng)Sora2引爆話題之時(shí),社交媒體上也傳出了大廠國慶連續(xù)加班研究的消息。

Sora2 生成視頻
于今其所要面對(duì)的問題是,在Sora2已經(jīng)將“AI生成視頻工具”升級(jí)為“AI內(nèi)容平臺(tái)”的今天,誰能最先在國產(chǎn)賽道上拿出可對(duì)標(biāo)的產(chǎn)品?或許這一次的戰(zhàn)略性“對(duì)標(biāo)”,反而能夠?yàn)槠涫冀K未能找到出路的AI內(nèi)容真正解套。
01 從模型到平臺(tái):Sora2為何成為“現(xiàn)象級(jí)產(chǎn)品”
要理解Sora2所引起的轟動(dòng)效應(yīng),必須先認(rèn)識(shí)到它帶來的,其實(shí)并非單純意義上“視頻生成能力”的升級(jí),反而是長久以來對(duì)于“AIGC內(nèi)容”敘事范式的再定義。
首先,Sora2在內(nèi)容生產(chǎn)的維度上實(shí)現(xiàn)了質(zhì)變。
它最大的突破在于“音畫同步”和“物理一致性”的雙重躍遷:視頻中的光影、重力、碰撞、鏡頭語言都比前代自然得多,甚至連人物對(duì)話、背景音效、情緒氛圍都可以自動(dòng)生成。

Sora2 生成視頻
這意味著AI第一次具備了“編導(dǎo)級(jí)”的綜合敘事能力——不僅能“畫出”一個(gè)世界,還能“讓這個(gè)世界活起來”。在傳統(tǒng)影視行業(yè),這相當(dāng)于從一支美術(shù)團(tuán)隊(duì)變成了一個(gè)完整的制作公司。
其次,Sora2的產(chǎn)品形態(tài)本身更具戰(zhàn)略意味。
OpenAI沒有讓它停留在“API模型”或“開發(fā)者工具”的層面,而是直接推出了Sora App,一個(gè)具備創(chuàng)作、分發(fā)、互動(dòng)、推薦等功能的“AI原生內(nèi)容平臺(tái)”。
這一決策背后是對(duì)未來互聯(lián)網(wǎng)內(nèi)容生態(tài)的深刻洞察:AI不只是生產(chǎn)力工具,更是平臺(tái)競爭的新核心。當(dāng)生成能力與分發(fā)邏輯綁定,創(chuàng)作者行為就會(huì)被平臺(tái)設(shè)計(jì)重新塑造,生態(tài)壁壘也將因此建立。

Sora App截圖
接著,Sora2的“Cameo”功能進(jìn)一步拉近了人與AI內(nèi)容的距離。
用戶只需上傳一張人像或一段音頻,AI就能在生成的視頻中“代入”你的形象?!白晕彝渡洹钡哪芰Γ笰I視頻不再只是“看”的內(nèi)容,而是“參與”的內(nèi)容。這是“用戶創(chuàng)作行為的徹底重構(gòu)”——它把創(chuàng)作門檻降到零,同時(shí)激活了人類最本能的表達(dá)欲望。
最后,也是最具產(chǎn)業(yè)級(jí)意義的一點(diǎn):Sora2的社交屬性使其從“工具”變成了“平臺(tái)”。
它不再僅僅只是一個(gè)AI文生視頻大模型,而是一個(gè)內(nèi)容分發(fā)系統(tǒng);它不只是為創(chuàng)作者服務(wù)的API,而是一個(gè)可能吸引數(shù)億用戶日活的短視頻入口。

Sora App發(fā)布后首周下載量
可以說正是這一架構(gòu)使其對(duì)Meta和Tiktok產(chǎn)生了結(jié)構(gòu)性威脅,因?yàn)樗袧摿母旧现厮芏桃曨l平臺(tái)的競爭格局——當(dāng)“視頻生產(chǎn)”本身不再是人的專屬能力,平臺(tái)之間拼的就不再只是內(nèi)容,而是“生成 + 分發(fā)”的一體化體驗(yàn)。
并且,OpenAI可以毫無包袱的去做這件事,畢竟對(duì)他們來說,將更具娛樂消費(fèi)屬性的Sora與生產(chǎn)力屬性更強(qiáng)的ChatGPT區(qū)隔開來,反而有助于兩個(gè)平臺(tái)各自的有效增長。
02 追兵的機(jī)會(huì)與困局:即夢 vs 可靈
如果說OpenAI的Sora2為全球 AI 視頻賽道樹立了新的標(biāo)桿,那么,在中國市場,最有機(jī)會(huì)追上的,顯然是字節(jié)跳動(dòng)的即夢 與快手的可靈。
兩者都已經(jīng)邁出了第一步,但前路各有優(yōu)勢與短板。
從基礎(chǔ)能力看,即夢更像是“產(chǎn)品派”的代表。
它背靠字節(jié)的剪映、抖音生態(tài),具備天然的分發(fā)入口和用戶場景優(yōu)勢。即夢的Seaweed模型已經(jīng)支持文本生成視頻、動(dòng)作模仿、多模態(tài)參考等功能,平臺(tái)內(nèi)還集成了創(chuàng)作、編輯、分享的完整生產(chǎn)鏈條。

即夢AI制作的短片《權(quán)利童話》
字節(jié)的強(qiáng)項(xiàng)顯然不在于最前沿的模型研發(fā),更多還是依靠產(chǎn)品邏輯做成生態(tài)閉環(huán):只要生成質(zhì)量達(dá)到“可用”水平,就可以借助抖音的流量分發(fā)迅速起量。這也是為什么即夢雖然相對(duì)后發(fā),卻同樣能夠快速獲得大批用戶青睞。
它的短板同樣明顯:目前的即夢在音畫同步、物理細(xì)節(jié)、長時(shí)視頻一致性上,仍與Sora2甚至是可靈存在著差距。更重要的是,抖音如此巨大的體量之下,除非是AI視頻的確有什么巨大突破,否則很難說服大部分用戶必須用即夢來做視頻。
可靈的路線則更偏“技術(shù)派”。

可靈AI生成視頻截圖
快手從一開始就強(qiáng)調(diào)模型層面的突破:在2.0版本中,可靈引入了多模態(tài)視覺語言(MVL)、多圖參考、3D軌跡控制等技術(shù)模塊,目標(biāo)是逐步接近Sora2的生成質(zhì)量。
更重要的是,可靈已具備生成數(shù)分鐘長視頻和復(fù)雜鏡頭語言的能力,并開始探索“視頻續(xù)寫”“鏡頭編排”等更貼近影視制作的方向。從技術(shù)潛力來看,可靈也許比即夢更接近“對(duì)標(biāo)產(chǎn)品”的目標(biāo)。
然而,快手需要面對(duì)的是生態(tài)問題:它的分發(fā)能力和創(chuàng)作者生態(tài)不如字節(jié)龐大,平臺(tái)對(duì)用戶生成內(nèi)容的承載能力相對(duì)有限。換句話說,可靈或許能先跑出“模型層面的對(duì)標(biāo)”,但未必能先跑出“產(chǎn)品層面的平臺(tái)”。

可靈AI單元故事集《新世界加載中》
然而,真正制約這場競爭走向的,或許并不是技術(shù),更多還是商業(yè)層面的考量。國內(nèi)AI文生視頻目前最大的困境在于,依然沒有找到真正的商業(yè)模式。
根據(jù)快手發(fā)布的2025年第二季度財(cái)報(bào)顯示,可靈AI在該季度的營收達(dá)到了2.5億元,較去年有了數(shù)倍增長,然而,影響的客戶其實(shí)依然還是專業(yè)機(jī)構(gòu)或是自媒體。本質(zhì)上來說,AI視頻生產(chǎn)工具并不屬于大眾消費(fèi)產(chǎn)品。
即便是過去一年被寄予厚望的“AI短劇”,也沒有演化出一個(gè)足夠有規(guī)模、有利潤的生態(tài)系統(tǒng)。多數(shù)項(xiàng)目仍然依賴補(bǔ)貼或營銷預(yù)算驅(qū)動(dòng),無法自我造血,用戶的留存和付費(fèi)意愿也遠(yuǎn)未驗(yàn)證。在這種背景下,如果讓文生視頻作為“功能模塊”嵌入到抖音、快手等主平臺(tái)之中,便很難成為業(yè)務(wù)增長的新支點(diǎn)。

用戶生成的AI短劇
更重要的是,如果讓抖音和快手本體直接承擔(dān)AI視頻生產(chǎn)的任務(wù),不僅面臨注意力被稀釋、用戶體驗(yàn)受影響的風(fēng)險(xiǎn),也會(huì)引出復(fù)雜的倫理與法律問題——例如真人視頻與AI視頻的混雜如何標(biāo)注、內(nèi)容責(zé)任如何界定、算法推薦是否應(yīng)區(qū)分來源等。
正因如此,從產(chǎn)品形態(tài)的角度來看,打造一個(gè)“只允許AIGC視頻存在”的獨(dú)立平臺(tái),不僅是未來競爭的方向,也可能是行業(yè)走向成熟的必要條件。
Sora2的出現(xiàn),讓“AI視頻”從技術(shù)演示變成了行業(yè)主戰(zhàn)場。它不只是重新定義了“內(nèi)容怎么生產(chǎn)”,還在重塑內(nèi)容如何被分發(fā)、創(chuàng)作者如何被激發(fā)、平臺(tái)如何被重構(gòu)。

Sora2 生成視頻
對(duì)于抖音和快手而言,壓力同樣來源于需要用AI產(chǎn)品來和自己原本的內(nèi)容平臺(tái)打擂臺(tái),這其實(shí)是OpenAI所不需要考慮的問題,畢竟它只是從零開始去顛覆,才能夠如此不管不顧。
這倒是也是為什么按照國內(nèi)產(chǎn)品“對(duì)標(biāo)”的能力,原本以為加班一個(gè)國慶大概就應(yīng)該已經(jīng)有類似產(chǎn)品的1.0版本出現(xiàn),但快兩周過去,大家依然還是熱火朝天的在討論Sora2,卻沒見到兩家大廠的跟進(jìn)動(dòng)作。
理論上來看誰愿意先做出真正意義上的“國產(chǎn)Sora2”,其實(shí)也決定兩家公司各自的AI戰(zhàn)略走向,更重要的是在AI創(chuàng)作內(nèi)容這個(gè)層面,“視頻”始終還是皇冠上的明珠,無法在這一能力上占得一席之地,其實(shí)到頭來也很難說把“AI故事”講完整。

