界面新聞記者 | 宋佳楠
當?shù)貢r間12月22日,兩屆普利策新聞獎得主約翰·卡雷魯牽頭的作家群體,向美國加州北區(qū)地方法院提起集體訴訟,將OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家AI巨頭列為共同被告,指控其通過盜版書籍訓(xùn)練模型構(gòu)成“蓄意侵權(quán)”??ɡ佐斣衣读斯韫妊簷z測創(chuàng)業(yè)公司Theranos的驚天騙局,并據(jù)此出版書籍《滴血成金》。
訴狀顯示,原告核心指控集中于“雙重侵權(quán)鏈條”:六公司從LibGen、Z-Library等“非法影子圖書館”批量下載數(shù)百萬冊小說、紀實作品等盜版書籍,再將這些著作用于大語言模型訓(xùn)練與產(chǎn)品優(yōu)化,形成“盜版獲取-模型訓(xùn)練-商業(yè)變現(xiàn)” 的非法閉環(huán)。原告方強調(diào),作家的智力成果支撐起“價值數(shù)十億美元的AI生態(tài)”,卻未獲分文補償。
若陪審團認定侵權(quán)屬故意行為,每部侵權(quán)作品最高可獲賠15萬美元。
此次訴訟并非AI公司首次卷入文字作品侵權(quán)糾紛。據(jù)南都數(shù)字經(jīng)濟治理研究中心報告,OpenAI是行業(yè)“被訴大戶”,已面臨至少14起版權(quán)訴訟。
早在2023年底,《紐約時報》就侵犯版權(quán)起訴微軟和OpenAI,稱報紙發(fā)表的數(shù)百萬篇文章被用于訓(xùn)練智能聊天機器人(如微軟Copilot和ChatGPT )?!都~約時報》認為,被告應(yīng)為非法復(fù)制和使用《紐約時報》獨特而有價值的作品相關(guān)的數(shù)十億美元的損失負責。同時,《紐約時報》還要求被告銷毀使用其版權(quán)材料的任何AI模型和訓(xùn)練數(shù)據(jù)。

而在今年6月,OpenAI發(fā)表聲明稱,正在對《紐約時報》要求無限期保留消費者ChatGPT和API客戶數(shù)據(jù)的訴訟請求提起上訴。OpenAI認為這項訴訟請求從根本上違背了其對用戶做出的隱私承諾,是越權(quán)行為。
與《紐約時報》有版權(quán)糾紛的不只OpenAI。去年10月,《紐約時報》還向生成式AI初創(chuàng)公司Perplexity發(fā)出“停止并終止”通知,要求后者停止訪問和使用其內(nèi)容。
谷歌則在12月初剛收到迪士尼的停止侵權(quán)函,被指“未經(jīng)授權(quán)復(fù)制海量版權(quán)作品用于AI開發(fā)”。Meta同樣因模型訓(xùn)練數(shù)據(jù)問題,多次收到好萊塢大廠的侵權(quán)警告。
Anthropic的侵權(quán)事件則更具標志性。該公司因使用盜版書籍訓(xùn)練Claude模型被告,2025年6月被美國加州法院裁定“盜版數(shù)據(jù)不適用合理使用”,最終迫使Anthropic支付15億美元和解并銷毀侵權(quán)數(shù)據(jù)。
而xAI與Perplexity AI雖成立時間較短,但此次被指控的侵權(quán)模式與行業(yè)巨頭高度一致,暴露出AI公司對盜版數(shù)據(jù)的依賴。
該案審理地加州北區(qū)法院已受理25起AI版權(quán)案件,占全美同類案件半數(shù)以上,其判決結(jié)果或?qū)⒊蔀榻缍ˋI訓(xùn)練數(shù)據(jù)合法性的關(guān)鍵標尺。


