文 | 雪豹財(cái)經(jīng)社 于米
一提到“數(shù)據(jù)標(biāo)注公司”,外界的印象通常是:
技術(shù)含量低、工作內(nèi)容重復(fù)枯燥、依賴大量低成本人力完成簡(jiǎn)單機(jī)械的標(biāo)注任務(wù),例如給圖片打標(biāo)簽、文本分類或音頻轉(zhuǎn)錄。這類公司被視作AI產(chǎn)業(yè)鏈底層“苦力”,利潤(rùn)微薄、附加值低,很難形成核心競(jìng)爭(zhēng)力或行業(yè)話語(yǔ)權(quán)。在公眾眼中,它們更多是幕后無(wú)名的外包工廠,而非高科技創(chuàng)新企業(yè)。
不過(guò),隨著一筆硅谷投資交易浮出水面,你可能要重新構(gòu)建對(duì)數(shù)據(jù)標(biāo)注公司的價(jià)值評(píng)估了。
據(jù)多家媒體報(bào)道,6月中旬,F(xiàn)acebook母公司Meta出資143億美元(約合人民幣1028億元)獲得數(shù)據(jù)標(biāo)注公司Scale AI的49%無(wú)投票權(quán)股份,將后者的估值一舉推高到了290億美元(約合人民幣2082億元)。
你可能對(duì)290億美元的估值沒(méi)有概念。截至6月20日收盤,百度和理想汽車的市值分別是287.5億美元和263.6億美元。
這是Meta歷史上第二大投資,僅次于2014年以190億美元收購(gòu)WhatsApp。作為交易的一部分,Scale AI創(chuàng)始人兼CEO Alexandr Wang在保留原公司董事會(huì)成員身份的同時(shí),也將攜部分公司成員加入Meta。
一石激起千層浪。
得知這一消息后,包括谷歌、微軟、OpenAI、馬斯克的xAI等在內(nèi)多家AI巨頭先后表示計(jì)劃撤出與Scale AI的合作。而Scale AI空出的訂單,正被一眾同行瘋搶。
一家數(shù)據(jù)標(biāo)注公司何以賣出千億,Meta這次的大動(dòng)作背后,藏著多少AI巨頭們殘酷爭(zhēng)斗的暗線?
何以估值2000億?
算力是AI軍備競(jìng)賽中的關(guān)鍵戰(zhàn)略資源。要下場(chǎng)做大模型就得囤顯卡,已然成為了一個(gè)共識(shí)。但易為人忽視的是,訓(xùn)練數(shù)據(jù)的質(zhì)量決定了模型能力的上限,它與囤卡同樣至關(guān)重要。
打個(gè)比方,如果說(shuō)大模型是一個(gè)勤奮的學(xué)生,訓(xùn)練數(shù)據(jù)就相當(dāng)于它的教材。只有給大模型投喂高質(zhì)量的數(shù)據(jù),大模型才能夠給出真實(shí)、準(zhǔn)確、全面和符合倫理的回答。反之,則會(huì)越學(xué)越糊涂,無(wú)法提供符合預(yù)期的輸出。
流傳于業(yè)內(nèi)的一句俗語(yǔ)說(shuō),“垃圾進(jìn),垃圾出”,說(shuō)的就是這個(gè)道理。在Scaling Laws逐漸失效,靠算力和模型規(guī)模硬解的打法陷入瓶頸的當(dāng)下,提高數(shù)據(jù)質(zhì)量有時(shí)甚至能起到點(diǎn)石成金的奇效。
以往,數(shù)據(jù)標(biāo)注工作主要集中在文本、圖像和音視頻等方面。但現(xiàn)在的數(shù)據(jù)標(biāo)注開(kāi)始變得更為復(fù)雜。隨著行業(yè)轉(zhuǎn)向帶有“思維鏈”的推理模型,專家數(shù)據(jù)成為了AI巨頭們眼中的金礦。
這也是為什么如今的AI標(biāo)注團(tuán)隊(duì)里,你不僅能看到完成單調(diào)原始工作的合同工和外包人員,有時(shí)也會(huì)看到不同學(xué)科和領(lǐng)域的專業(yè)人士。他們會(huì)寫(xiě)下解決復(fù)雜問(wèn)題所需要的思考步驟,輔導(dǎo)大模型模仿人類的思考方式。
Scale AI的商業(yè)模式,正是為客戶提供數(shù)據(jù)標(biāo)注解決方案。通過(guò)Remotasks和Outlier AI這樣的平臺(tái),他們招募并管理著全球數(shù)以十萬(wàn)計(jì)的勞動(dòng)力。同時(shí),他們也開(kāi)出不菲的時(shí)薪來(lái)吸引計(jì)算機(jī)科學(xué)、數(shù)學(xué)、自然科學(xué)、社會(huì)科學(xué)等專業(yè)的博士來(lái)撰寫(xiě)語(yǔ)料。
但若只是如此,Scale AI和市面上其他的數(shù)據(jù)標(biāo)注公司并沒(méi)有形成差異。
這家公司的真正優(yōu)勢(shì)在于,通過(guò)AI輔助的自動(dòng)化標(biāo)注能力和成熟的平臺(tái)體系,他們能夠高效且靈活地滿足不同客戶的定制化需求,從一家單純的數(shù)據(jù)標(biāo)注公司,一躍成為能夠深度參與數(shù)據(jù)管理與模型訓(xùn)練流程的數(shù)據(jù)基礎(chǔ)設(shè)施企業(yè)。
此前,Scale AI已經(jīng)贏得了Meta、OpenAI、Google、微軟和美國(guó)政府等大金主的訂單。這些頂級(jí)客戶不僅為Scale AI帶來(lái)了不菲的收入,也為之提高了聲譽(yù),給估值的水漲船高提供了背書(shū)。
2024年,Scale AI的營(yíng)收達(dá)到8.7億美元,其估值在與Meta的交易之前就來(lái)到了140億美元。
Meta下場(chǎng),谷歌們“割席”
Meta拿下Scale AI的49%股份,最顯而易見(jiàn)的收獲當(dāng)然是后者在數(shù)據(jù)標(biāo)注業(yè)務(wù)上的能力。
有了Scale AI的加持,Meta可以依托前者現(xiàn)有的平臺(tái),建立起一個(gè)大型的高質(zhì)量數(shù)據(jù)標(biāo)注網(wǎng)絡(luò),助力自家大模型Llama的開(kāi)發(fā)。
今年4月初,Meta發(fā)布了最新開(kāi)源大模型Llama 4,可它卻完全沒(méi)有了前代產(chǎn)品的驚艷,不但在實(shí)測(cè)中表現(xiàn)平平,甚至還被爆出了疑似在基準(zhǔn)測(cè)試中作弊的丑聞。而其旗艦?zāi)P虰ehemoth一再推遲發(fā)布,至今難產(chǎn)。
如果能夠通過(guò)訓(xùn)練數(shù)據(jù)質(zhì)量的提升來(lái)改善模型的真實(shí)水平,或許可以拯救Meta在開(kāi)發(fā)大模型這一戰(zhàn)線上的頹勢(shì),縮小與OpenAI和Anthropic等對(duì)手的身位差距。
不過(guò),光看這一點(diǎn),可能還無(wú)法解釋Meta為何愿意按照Scale AI一年前估值(140億美元)的兩倍來(lái)出價(jià),尤其是考慮到從2023年到2024年,Scale AI的營(yíng)收不過(guò)從7.6億美元提高到8.7億美元。
有業(yè)內(nèi)人士猜測(cè),除了搶占大模型訓(xùn)練數(shù)據(jù)這一座山頭之外,Meta對(duì)Scale AI的這筆大額投資,其實(shí)還有通過(guò)Scale AI了解對(duì)手研發(fā)動(dòng)態(tài)的目的。
正如Handshake(Scale AI的競(jìng)爭(zhēng)對(duì)手)的CEO Garrett Lord所說(shuō):“如果你是通用汽車或豐田,你不會(huì)希望你的競(jìng)爭(zhēng)對(duì)手走進(jìn)你的制造工廠,看你的流程是如何運(yùn)轉(zhuǎn)的。”
雖然Scale AI作為一家數(shù)據(jù)標(biāo)注公司無(wú)法接觸到大模型的核心算法,但他們有機(jī)會(huì)從接觸到的數(shù)據(jù)和產(chǎn)品模型對(duì)客戶的商業(yè)戰(zhàn)略和研發(fā)重點(diǎn)進(jìn)行了解。
可能正是出于這樣的擔(dān)憂,盡管Scale AI的發(fā)言人Joe Osborne在一份聲明中表示“公司將繼續(xù)保持獨(dú)立”,多家主要客戶(包括谷歌、微軟、OpenAI、馬斯克的xAI等)都決定退出與Scale AI的合作。
這其中,谷歌作為Scale AI的最大客戶,原本計(jì)劃在今年支付2億美元購(gòu)買人工標(biāo)注數(shù)據(jù)。去年Scale AI 8.7億美元的營(yíng)收中,谷歌一家就貢獻(xiàn)了1.5億美元。
AI巨頭們果斷切割的想法其實(shí)很好理解,與Scale AI的合作涉及高度敏感的商業(yè)機(jī)密,他們不可能放心將這些交給Meta大額持股的公司。
當(dāng)下,各家數(shù)據(jù)標(biāo)注公司還在鯰魚(yú)搶食,冀望吃下Scale AI “被分手”以后空出的訂單量。Handshake一夜之間訂單量激增到原來(lái)的三倍,Labelbox的CEO則表示,該公司可能會(huì)從Scale AI的老客戶那里獲得數(shù)億美元的收入。
Scale AI將如何度過(guò)這一波用戶流失潮,目前還不得而知。但這筆交易可能會(huì)成為數(shù)據(jù)標(biāo)注行業(yè)的轉(zhuǎn)折點(diǎn)??梢灶A(yù)見(jiàn)的是,AI巨頭們要么會(huì)加大投入去養(yǎng)自家的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),要么就會(huì)將需求分散到多家供應(yīng)商。
無(wú)論哪種模式下,數(shù)據(jù)標(biāo)注行業(yè)或許將很難再滋養(yǎng)出一家超大公司——AI巨頭們不會(huì)允許自己的數(shù)據(jù)供應(yīng)鏈被一家獨(dú)大的供應(yīng)商拿捏。
AI大戰(zhàn)來(lái)到新高度
僅從賬面上看,Meta花費(fèi)如此大的代價(jià)投資Scale AI,算不上是一筆好買賣。
Scale AI原本被看好在2025年實(shí)現(xiàn)20億美元的營(yíng)收,但在流失了多家重量級(jí)客戶之后,哪怕汽車自動(dòng)駕駛和政府業(yè)務(wù)相關(guān)的客戶全部留下,要達(dá)到這一業(yè)績(jī)也難度頗高。
而其290億美元的天價(jià)估值,也將在對(duì)客戶的吸引力下降后冷卻下來(lái)。有媒體報(bào)道稱,Scale AI的一位早期投資者已經(jīng)萌生了套現(xiàn)離場(chǎng)的想法。
很難想象Meta會(huì)對(duì)這樣的業(yè)界反應(yīng)毫無(wú)預(yù)料,但或許從一開(kāi)始,Meta就沒(méi)有帶著要在財(cái)務(wù)投資中獲利的心態(tài)去做交易。
Meta真正的意圖是什么?他們想要的不僅是Scale AI,還有Scale AI背后的領(lǐng)路人Alexandr Wang。
類似的“招聘式投資”近些年在硅谷早有先例。
去年,微軟花費(fèi)6.5億美元,換來(lái)AI初創(chuàng)公司Inflection的軟件授權(quán),并聘用了該公司包括老板Mustafa Suleyman在內(nèi)的大部分員工。在一筆類似的操作中,谷歌以逾20億美元的估值投資Character.ai,好讓后者團(tuán)隊(duì)中的30人加入Gemini的開(kāi)發(fā)。
對(duì)于規(guī)模龐大、組織僵化以至于缺乏創(chuàng)新土壤的大公司來(lái)說(shuō),直接以這種方式引入經(jīng)過(guò)市場(chǎng)驗(yàn)證的人才,也不失為一種破局的手段。
Meta確實(shí)也十分看重Alexandr Wang的加盟,他們一度想授予這位年輕人“首席AI官”的頭銜。接下來(lái),Meta計(jì)劃讓他擔(dān)任新部門“超級(jí)智能(Superintelligence)”的高級(jí)崗位,直接向扎克伯格匯報(bào)。
有趣的是,雖然Alexandr Wang即將成為”超級(jí)智能“實(shí)驗(yàn)室的領(lǐng)導(dǎo)者,但他卻并非科班出身的研究人員。
2016年,年僅19歲的Alexandr Wang在用AI攝像頭來(lái)監(jiān)控冰箱庫(kù)存的嘗試中,發(fā)現(xiàn)了AI數(shù)據(jù)標(biāo)注的巨大商機(jī),當(dāng)年他就從MIT輟學(xué)并創(chuàng)立了Scale AI。
在經(jīng)歷了初期的探索后,這家公司開(kāi)始專注于與自動(dòng)駕駛相關(guān)的數(shù)據(jù)標(biāo)注工作,隨后又開(kāi)始將業(yè)務(wù)重心轉(zhuǎn)向生成式AI。24歲時(shí),Alexandr Wang成為全世界最年輕的白手起家億萬(wàn)富翁。
Alexandr Wang也以其過(guò)人的社交能力在圈內(nèi)著稱,OpenAI的CEO Altman就和他關(guān)系密切。Scale AI能夠接連從AI巨頭和美國(guó)政府手里接下訂單,與Alexandr Wang強(qiáng)大的人脈也不無(wú)關(guān)系。
此前,據(jù)Altman爆料,Meta曾拿出1億美金的簽約獎(jiǎng)金到OpenAI撬墻角未果。隨著Alexandr Wang的加盟,Meta不但完成了一次頂級(jí)人才的重磅引進(jìn),也給后續(xù)繼續(xù)招兵買馬增加了砝碼。
在對(duì)元宇宙的巨額投資收益慘淡,大模型研發(fā)又開(kāi)始落后于頭部對(duì)手的當(dāng)下,Meta試圖通過(guò)“超級(jí)智能”彎道超車以?shī)Z回AI大戰(zhàn)主動(dòng)權(quán),也不失為一次富有魄力的嘗試。
買數(shù)據(jù)、挖情報(bào)、搶人......Meta通過(guò)對(duì)Scale AI的收購(gòu),已經(jīng)將硅谷的AI大戰(zhàn)帶到了新的高度。不管接下來(lái)還有什么精彩戲碼上演,這場(chǎng)大戰(zhàn)還遠(yuǎn)遠(yuǎn)沒(méi)有迎來(lái)拐點(diǎn)。

