文丨AI價(jià)值官 星 野
編輯丨美圻
沒有發(fā)布會(huì),沒有技術(shù)博客,沒有任何公司背書——一款名為HappyHorse-1.0 的文本轉(zhuǎn)視頻模型,悄然登頂權(quán)威AI評(píng)測平臺(tái)Artificial Analysis的AI Video Arena排行榜,以更高的Elo分?jǐn)?shù)壓過了Seedance 2.0,更將可靈、天工等一眾主流玩家甩在身后,一時(shí)之間引發(fā)了技術(shù)圈的“解密競賽”。
Artificial Analysis的排名不是技術(shù)參數(shù)評(píng)測,而是真實(shí)用戶盲測結(jié)果匯總出來的 Elo 積分,反映的是普通人看過之后的真實(shí)感知。這讓這個(gè)排名比通常的跑分榜更難被輕易質(zhì)疑,也讓“這東西到底是誰做的”變成了一個(gè)無法忽視的問題。
“快樂馬”悄然登頂,引發(fā)科技圈猜謎競賽
X上的猜測來得很快。最先被人注意到的,是官網(wǎng)的語言排序:普通話和粵語排在英語前面。對(duì)于一個(gè)面向全球用戶的產(chǎn)品,這個(gè)順序有點(diǎn)反?!绻敲绹鴪F(tuán)隊(duì)主導(dǎo),英語幾乎不可能不是第一位。背后團(tuán)隊(duì)來自中國,基本可以確認(rèn)。

名字本身也是線索。2026年是農(nóng)歷馬年,“HappyHorse”這個(gè)命名藏著不太含蓄的馬年梗,今年早些時(shí)候“Pony Alpha”也玩過類似套路。于是嫌疑名單迅速拉長:騰訊和阿里的創(chuàng)始人都姓馬,天然在列;有人押注小米,覺得雷軍一貫低調(diào),喜歡突然亮牌;也有人覺得氣質(zhì)更像DeepSeek,畢竟DS此前曾悄悄上線過視覺模型,后來又悄悄下線了。各路猜測熱鬧非凡,但沒一個(gè)拿得出實(shí)錘。
真正鎖定目標(biāo)的,是技術(shù)層面的逐條比對(duì)。X用戶Vigo Zhao把HappyHorse-1.0 的公開基準(zhǔn)數(shù)據(jù)拿去和已知模型一一核對(duì),結(jié)果找到了一個(gè)高度吻合的對(duì)象:daVinci-MagiHuman,也就是3月上線Github的開源模型“達(dá)芬奇魔法人類”。

視覺質(zhì)量4.80、文本對(duì)齊4.18、物理一致性4.52、語音字錯(cuò)率14.60%——兩份數(shù)據(jù)逐項(xiàng)對(duì)得上。官網(wǎng)結(jié)構(gòu)也幾乎一樣:架構(gòu)描述、性能表格、演示視頻的呈現(xiàn)風(fēng)格,都像是出自同一套模板。兩者同為單流Transformer架構(gòu),同為音視頻聯(lián)合生成,支持的語言列表也完全一致。這種程度的重合,很難用巧合解釋。
目前技術(shù)圈認(rèn)可度最高的結(jié)論是,HappyHorse 是daVinci-MagiHuman聯(lián)合開發(fā)方之一的Sand.ai,基于開源模型優(yōu)化的迭代版本,核心目的是驗(yàn)證模型在用戶真實(shí)偏好下的表現(xiàn)上限,為后續(xù)的商業(yè)化落地做鋪墊。

daVinci-MagiHuman在2026年3月23日正式開源,是兩支年輕團(tuán)隊(duì)合作的產(chǎn)物。一支來自上海創(chuàng)智學(xué)院(SII)生成式人工智能研究實(shí)驗(yàn)室(GAIR),帶頭人是學(xué)者劉鵬飛;另一支是北京的 Sand.ai(三呆科技),創(chuàng)始人曹越同樣有學(xué)術(shù)背景,公司方向是自回歸世界模型。
模型用的是150億參數(shù)的純自注意力單流 Transformer,把文本、視頻、音頻三種模態(tài)的 token 全部塞進(jìn)同一個(gè)序列里聯(lián)合建?!_源界此前還沒有人從零開始做過真正的音視頻聯(lián)合預(yù)訓(xùn)練,大多數(shù)是在單模態(tài)基礎(chǔ)上拼接。
一款開源視頻模型,何以實(shí)現(xiàn)兩周逆襲?
身份搞清楚之后,另一個(gè)問題反而更難回答:daVinci-MagiHuman3月底才開源,HappyHorse-1.0憑什么能在短短兩周內(nèi)拿到比Seedance 2.0更高的Elo分?jǐn)?shù)?
從官網(wǎng)披露的信息來看,HappyHorse并沒有對(duì)底層架構(gòu)動(dòng)過什么手腳,比較合理的猜測是,它在默認(rèn)生成策略上針對(duì)評(píng)測場景做了專項(xiàng)調(diào)整。
Elo體系本質(zhì)上是用戶偏好的累積,人物表情穩(wěn)定不穩(wěn)定、音畫有沒有對(duì)齊、畫面是否賞心悅目,這些感知敏感項(xiàng)上稍微做好一點(diǎn),在盲測里就容易被選中。模型的能力上限沒變,但“評(píng)測表現(xiàn)”可以被打磨出來。
事實(shí)上,Artificial Analysis的盲測樣本中,人像生成、口播類內(nèi)容占比超過 60%,而daVinci-MagiHuman從訓(xùn)練階段就聚焦人像演繹,在該類場景中天然具備優(yōu)勢,這也是其盲測勝率領(lǐng)先的核心原因;盲測樣本如果以人像特寫為主,擅長人像的模型就會(huì)系統(tǒng)性地占便宜,跟它在多人物、復(fù)雜運(yùn)鏡、長時(shí)序敘事等復(fù)雜場景下的實(shí)際表現(xiàn)沒有直接關(guān)系。

結(jié)果是,排行榜上的數(shù)字和實(shí)測體驗(yàn)之間出現(xiàn)了明顯的落差,X上的討論者也分成了兩派。懷疑派在測試后認(rèn)為,HappyHorse-1.0與Seedance 2.0在人物細(xì)節(jié)、動(dòng)態(tài)連貫性上仍有可見差距,并由此質(zhì)疑Elo評(píng)分本身的代表性。
而支持者則對(duì)HappyHorse的潛力寄予厚望,希望它能夠解決“多鏡頭序列中的畫質(zhì)一致性”這一行業(yè)痛點(diǎn),因?yàn)檫@是當(dāng)前主流視頻模型都沒解決好的問題,如果 daVinci-MagiHuman真的在這里有所突破,可能要比一個(gè)榜單排名重要得多。

模型本身的局限也不該被數(shù)字掩蓋。小紅書博主@JACK的AI視界 曾第一時(shí)間部署、實(shí)測了daVinci-MagiHuman。發(fā)現(xiàn)它跑起來需要H100,普通消費(fèi)級(jí)顯卡基本沒戲,雖然社區(qū)在研究量化方案,但短期內(nèi)個(gè)人用戶想本地部署還是有難度。
場景上,它目前主要擅長單一人物,一旦多人出鏡或者場景變復(fù)雜,效果就會(huì)掉下來——這不是調(diào)參能解決的問題,和它專注人像的設(shè)計(jì)取向有直接關(guān)系。生成時(shí)長一般也就10秒上下,再長容易亂,高清輸出還得靠超分插件補(bǔ)。
@JACK的AI視界得出的結(jié)論是:daVinci-MagiHuman綜合易用性不如LTX 2.3,需要得等社區(qū)把量化做好之后才適合日常使用。
視頻生成賽道等來了真正的“鯰魚”?
當(dāng)然,一次榜單領(lǐng)先并不能說明太多。接下來,HappyHorse還需要在穩(wěn)定性、高并發(fā)訪問速度、跨場景一致性、角色控制精度,以及評(píng)測集之外的泛化能力上接受更充分的檢驗(yàn)。這些,才是決定一個(gè)模型能否真正進(jìn)入創(chuàng)作者工作流的核心指標(biāo)。
但如果把視野放到更大的行業(yè)格局,這件事傳遞的信號(hào)其實(shí)已經(jīng)足夠清晰。
開源視頻模型本身并不是新鮮事。但始終橫亙?cè)陂_源與閉源之間的,是一道效果層面的可見差距——在需要向客戶交付的場景里,開源模型的生成質(zhì)量長期未能跨過“可用”到“可交付”的門檻??伸`、Seedance等閉源產(chǎn)品的定價(jià)權(quán),在相當(dāng)程度上正是建立在這一差距之上。
這一次的意義在于,一個(gè)基于開源模型的產(chǎn)品,在以真實(shí)用戶感知為基準(zhǔn)的盲測排行榜上,首次正面比肩了當(dāng)前主流閉源競爭對(duì)手。不論其中有多少針對(duì)評(píng)測場景的調(diào)優(yōu)成分,對(duì)于依賴這一差距構(gòu)建定價(jià)權(quán)的閉源廠商而言,至少這是一個(gè)值得認(rèn)真對(duì)待的信號(hào)。
對(duì)開發(fā)者而言,這個(gè)拐點(diǎn)的含義更為具體。在人像、數(shù)字人、虛擬主播等垂直場景中,一旦開源基座的生成質(zhì)量觸及“可交付”的門檻,自主部署的成本結(jié)構(gòu)將發(fā)生實(shí)質(zhì)性變化——不僅是API調(diào)用成本的壓縮,更重要的是將數(shù)據(jù)、模型與推理鏈路完整地納入自身掌控,在定制化深度與隱私合規(guī)層面獲得閉源方案難以提供的靈活性。
HappyHorse-1.0短期內(nèi)不會(huì)動(dòng)搖 Seedance 2.0或可靈的市場地位,但開源模型效果可以媲美閉源這一認(rèn)知一旦確立,后續(xù)的量化優(yōu)化、垂直微調(diào)與推理加速將由社區(qū)以遠(yuǎn)超閉源產(chǎn)品的迭代速度持續(xù)推進(jìn)。
在這個(gè)馬年,真正值得關(guān)注的,或許不是哪匹馬跑得最快,而是賽道本身正在變寬。

