掃一掃下載界面新聞APP

神秘模型HappyHorse空降屠榜，視頻生成賽道迎來“鯰魚”？

從官網(wǎng)披露的信息來看，HappyHorse并沒有對(duì)底層架構(gòu)動(dòng)過什么手腳，比較合理的猜測是，它在默認(rèn)生成策略上針對(duì)評(píng)測場景做了專項(xiàng)調(diào)整。

AI價(jià)值官 ·

文丨AI價(jià)值官星野

編輯丨美圻

沒有發(fā)布會(huì)，沒有技術(shù)博客，沒有任何公司背書——一款名為HappyHorse-1.0 的文本轉(zhuǎn)視頻模型，悄然登頂權(quán)威AI評(píng)測平臺(tái)Artificial Analysis的AI Video Arena排行榜，以更高的Elo分?jǐn)?shù)壓過了Seedance 2.0，更將可靈、天工等一眾主流玩家甩在身后，一時(shí)之間引發(fā)了技術(shù)圈的“解密競賽”。

Artificial Analysis的排名不是技術(shù)參數(shù)評(píng)測，而是真實(shí)用戶盲測結(jié)果匯總出來的 Elo 積分，反映的是普通人看過之后的真實(shí)感知。這讓這個(gè)排名比通常的跑分榜更難被輕易質(zhì)疑，也讓“這東西到底是誰做的”變成了一個(gè)無法忽視的問題。

“快樂馬”悄然登頂，引發(fā)科技圈猜謎競賽

X上的猜測來得很快。最先被人注意到的，是官網(wǎng)的語言排序：普通話和粵語排在英語前面。對(duì)于一個(gè)面向全球用戶的產(chǎn)品，這個(gè)順序有點(diǎn)反?！绻敲绹鴪F(tuán)隊(duì)主導(dǎo)，英語幾乎不可能不是第一位。背后團(tuán)隊(duì)來自中國，基本可以確認(rèn)。

名字本身也是線索。2026年是農(nóng)歷馬年，“HappyHorse”這個(gè)命名藏著不太含蓄的馬年梗，今年早些時(shí)候“Pony Alpha”也玩過類似套路。于是嫌疑名單迅速拉長：騰訊和阿里的創(chuàng)始人都姓馬，天然在列；有人押注小米，覺得雷軍一貫低調(diào)，喜歡突然亮牌；也有人覺得氣質(zhì)更像DeepSeek，畢竟DS此前曾悄悄上線過視覺模型，后來又悄悄下線了。各路猜測熱鬧非凡，但沒一個(gè)拿得出實(shí)錘。

真正鎖定目標(biāo)的，是技術(shù)層面的逐條比對(duì)。X用戶Vigo Zhao把HappyHorse-1.0 的公開基準(zhǔn)數(shù)據(jù)拿去和已知模型一一核對(duì)，結(jié)果找到了一個(gè)高度吻合的對(duì)象：daVinci-MagiHuman，也就是3月上線Github的開源模型“達(dá)芬奇魔法人類”。

視覺質(zhì)量4.80、文本對(duì)齊4.18、物理一致性4.52、語音字錯(cuò)率14.60%——兩份數(shù)據(jù)逐項(xiàng)對(duì)得上。官網(wǎng)結(jié)構(gòu)也幾乎一樣：架構(gòu)描述、性能表格、演示視頻的呈現(xiàn)風(fēng)格，都像是出自同一套模板。兩者同為單流Transformer架構(gòu)，同為音視頻聯(lián)合生成，支持的語言列表也完全一致。這種程度的重合，很難用巧合解釋。

目前技術(shù)圈認(rèn)可度最高的結(jié)論是，HappyHorse 是daVinci-MagiHuman聯(lián)合開發(fā)方之一的Sand.ai，基于開源模型優(yōu)化的迭代版本，核心目的是驗(yàn)證模型在用戶真實(shí)偏好下的表現(xiàn)上限，為后續(xù)的商業(yè)化落地做鋪墊。

daVinci-MagiHuman在2026年3月23日正式開源，是兩支年輕團(tuán)隊(duì)合作的產(chǎn)物。一支來自上海創(chuàng)智學(xué)院（SII）生成式人工智能研究實(shí)驗(yàn)室（GAIR），帶頭人是學(xué)者劉鵬飛；另一支是北京的 Sand.ai（三呆科技），創(chuàng)始人曹越同樣有學(xué)術(shù)背景，公司方向是自回歸世界模型。

模型用的是150億參數(shù)的純自注意力單流 Transformer，把文本、視頻、音頻三種模態(tài)的 token 全部塞進(jìn)同一個(gè)序列里聯(lián)合建?！_源界此前還沒有人從零開始做過真正的音視頻聯(lián)合預(yù)訓(xùn)練，大多數(shù)是在單模態(tài)基礎(chǔ)上拼接。

一款開源視頻模型，何以實(shí)現(xiàn)兩周逆襲？

身份搞清楚之后，另一個(gè)問題反而更難回答：daVinci-MagiHuman3月底才開源，HappyHorse-1.0憑什么能在短短兩周內(nèi)拿到比Seedance 2.0更高的Elo分?jǐn)?shù)？

Elo體系本質(zhì)上是用戶偏好的累積，人物表情穩(wěn)定不穩(wěn)定、音畫有沒有對(duì)齊、畫面是否賞心悅目，這些感知敏感項(xiàng)上稍微做好一點(diǎn)，在盲測里就容易被選中。模型的能力上限沒變，但“評(píng)測表現(xiàn)”可以被打磨出來。

事實(shí)上，Artificial Analysis的盲測樣本中，人像生成、口播類內(nèi)容占比超過 60%，而daVinci-MagiHuman從訓(xùn)練階段就聚焦人像演繹，在該類場景中天然具備優(yōu)勢，這也是其盲測勝率領(lǐng)先的核心原因；盲測樣本如果以人像特寫為主，擅長人像的模型就會(huì)系統(tǒng)性地占便宜，跟它在多人物、復(fù)雜運(yùn)鏡、長時(shí)序敘事等復(fù)雜場景下的實(shí)際表現(xiàn)沒有直接關(guān)系。

結(jié)果是，排行榜上的數(shù)字和實(shí)測體驗(yàn)之間出現(xiàn)了明顯的落差，X上的討論者也分成了兩派。懷疑派在測試后認(rèn)為，HappyHorse-1.0與Seedance 2.0在人物細(xì)節(jié)、動(dòng)態(tài)連貫性上仍有可見差距，并由此質(zhì)疑Elo評(píng)分本身的代表性。

而支持者則對(duì)HappyHorse的潛力寄予厚望，希望它能夠解決“多鏡頭序列中的畫質(zhì)一致性”這一行業(yè)痛點(diǎn)，因?yàn)檫@是當(dāng)前主流視頻模型都沒解決好的問題，如果 daVinci-MagiHuman真的在這里有所突破，可能要比一個(gè)榜單排名重要得多。

模型本身的局限也不該被數(shù)字掩蓋。小紅書博主@JACK的AI視界曾第一時(shí)間部署、實(shí)測了daVinci-MagiHuman。發(fā)現(xiàn)它跑起來需要H100，普通消費(fèi)級(jí)顯卡基本沒戲，雖然社區(qū)在研究量化方案，但短期內(nèi)個(gè)人用戶想本地部署還是有難度。

場景上，它目前主要擅長單一人物，一旦多人出鏡或者場景變復(fù)雜，效果就會(huì)掉下來——這不是調(diào)參能解決的問題，和它專注人像的設(shè)計(jì)取向有直接關(guān)系。生成時(shí)長一般也就10秒上下，再長容易亂，高清輸出還得靠超分插件補(bǔ)。

@JACK的AI視界得出的結(jié)論是：daVinci-MagiHuman綜合易用性不如LTX 2.3，需要得等社區(qū)把量化做好之后才適合日常使用。

視頻生成賽道等來了真正的“鯰魚”？

當(dāng)然，一次榜單領(lǐng)先并不能說明太多。接下來，HappyHorse還需要在穩(wěn)定性、高并發(fā)訪問速度、跨場景一致性、角色控制精度，以及評(píng)測集之外的泛化能力上接受更充分的檢驗(yàn)。這些，才是決定一個(gè)模型能否真正進(jìn)入創(chuàng)作者工作流的核心指標(biāo)。

但如果把視野放到更大的行業(yè)格局，這件事傳遞的信號(hào)其實(shí)已經(jīng)足夠清晰。

開源視頻模型本身并不是新鮮事。但始終橫亙?cè)陂_源與閉源之間的，是一道效果層面的可見差距——在需要向客戶交付的場景里，開源模型的生成質(zhì)量長期未能跨過“可用”到“可交付”的門檻?？伸`、Seedance等閉源產(chǎn)品的定價(jià)權(quán)，在相當(dāng)程度上正是建立在這一差距之上。

這一次的意義在于，一個(gè)基于開源模型的產(chǎn)品，在以真實(shí)用戶感知為基準(zhǔn)的盲測排行榜上，首次正面比肩了當(dāng)前主流閉源競爭對(duì)手。不論其中有多少針對(duì)評(píng)測場景的調(diào)優(yōu)成分，對(duì)于依賴這一差距構(gòu)建定價(jià)權(quán)的閉源廠商而言，至少這是一個(gè)值得認(rèn)真對(duì)待的信號(hào)。

對(duì)開發(fā)者而言，這個(gè)拐點(diǎn)的含義更為具體。在人像、數(shù)字人、虛擬主播等垂直場景中，一旦開源基座的生成質(zhì)量觸及“可交付”的門檻，自主部署的成本結(jié)構(gòu)將發(fā)生實(shí)質(zhì)性變化——不僅是API調(diào)用成本的壓縮，更重要的是將數(shù)據(jù)、模型與推理鏈路完整地納入自身掌控，在定制化深度與隱私合規(guī)層面獲得閉源方案難以提供的靈活性。

HappyHorse-1.0短期內(nèi)不會(huì)動(dòng)搖 Seedance 2.0或可靈的市場地位，但開源模型效果可以媲美閉源這一認(rèn)知一旦確立，后續(xù)的量化優(yōu)化、垂直微調(diào)與推理加速將由社區(qū)以遠(yuǎn)超閉源產(chǎn)品的迭代速度持續(xù)推進(jìn)。

在這個(gè)馬年，真正值得關(guān)注的，或許不是哪匹馬跑得最快，而是賽道本身正在變寬。

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦，快來評(píng)價(jià)一下吧！

下載界面新聞

微信公眾號(hào)

微博