Meta 被指控使用 81.7TB 盜版書籍訓練 AI 模型

根據新近公開的法庭文件,Meta 面臨下載超過 81.7 TB 盜版書籍來訓練其人工智能模型的指控。這些爆料出現在莎拉·西爾弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey) 和克里斯托弗·戈爾登 (Christopher Golden) 等作者提起的版權侵權訴訟中,他們聲稱 Meta 在未經許可的情況下使用了他們的作品來開發其人工智能技術。

未密封的電子郵件表明,Meta 的高管,包括首席執行官馬克扎克伯格,已經意識到並批准使用來自著名盜版書籍存儲庫 Library Genesis (LibGen) 的數據來訓練他們的人工智能模型。內部通訊顯示,Meta 員工討論了掩蓋數據來源的策略,例如刪除明確的版權標記和更改元數據,以降低法律風險。

建議閱讀:法國作家指責 Meta 未經授權使用人工智能模型中的作品

Meta 為其行為辯護,聲稱在公開數據集上訓練人工智能模型構成版權法下的“合理使用”。該公司已提出駁回訴訟的動議,稱他們對數據的使用具有變革性,並且沒有侵犯作者的權利。

此案是針對科技公司更廣泛的法律挑戰浪潮的一部分,這些公司被指控未經授權使用受版權保護的材料來訓練人工智能係統。這些訴訟的結果可能對數字時代人工智能技術的發展和知識產權保護產生重大影響。