法院申請透露，梅塔（Meta）在受版權保護的書籍上培訓了其AI

新發布的

訴訟中包含的內部電子郵件表明，員工知道法律風險，但繼續培訓。這些文件還證實，元數據在進行未經批准的數據時停止了許可談判。

提交的備案是美國加利福尼亞州北區地區法院的版權訴訟的一部分，強調了梅塔的AI部門如何辯論該使用。盜版內容。該訴訟是在其數據收集實踐對包括OpenAI和Google在內的AI公司加大法律壓力之後。

新證據表明，梅塔高管表明，包括首席執行官馬克·扎克伯格那個元的工程師和法律團隊對使用受版權保護的書籍進行AI培訓有矛盾的看法。在一次討論中，一名員工建議最好先尋求批准，而不是先採取行動，然後要求寬恕:

“ [m] y的意見是（在’問寬恕，而不是為了許可’）:我們試圖獲取書籍並將其升級給執行者，以便他們打電話。”

儘管有風險旨在避免許可協議的成本和限制。

訴訟明確地聲稱，元數據從圖書館獲得了培訓數據（libgen），這是一個著名的在線庫存庫，用於盜版書籍。隨著員工調整設置以減少播種活動，這是通過點對點網絡共享文件時避免檢測的常見方法。

此外，訴訟聲稱Meta故意從其中刪除了版權管理信息（CMI）培訓數據。法院提出的文件指出:

這種指控特別嚴重，因為剝離CMI可能會違反《數字千年版權法》（DMCA），如果這樣做是為了掩蓋未經授權使用受版權保護的作品的使用。

Meta試圖編輯與其AI培訓數據有關的法院文件的部分，但Vince Chhabria法官裁定了對公司的裁定，表示:

“很明顯，元密封請求並非旨在防止披露敏感的業務信息……而是旨在避免宣傳。對AI公司的培訓實踐的司法審查及其不願披露數據來源的審查。法院的決定還與更廣泛的擔憂相吻合，即AI公司正在利用受版權保護的材料，而無需賠償內容創建者。

Meta是在AI培訓數據上面臨法律挑戰，並不是一個人。包括OpenAI和Google在內的其他公司也正在處理作者，出版商和媒體組織的訴訟。這些案例認為，AI生成的產出通常模仿受版權保護的文本，因此無牌培訓違反了知識產權法。

AI開發戰略Meta已將Llama作為Openai的GPT等專有模型的開源替代品。但是，最新的訴訟提出了有關該公司是否遵守道德AI實踐的疑問。

Meta的首席AI科學家Yann Lecun先前曾捍衛對書籍和數字知識的無限訪問，認為:

“只有少數圖書作者從書籍銷售中賺了巨大的錢。這似乎表明大多數書都應該可以免費下載。作者的收入損失將很小，相比之下，對社會的收益很大。”

lecun的評論反映了AI開發人員和版權持有人之間正在進行的意識形態鴻溝。一些人主張開放式AI培訓，AI培訓，作者和出版商認為，這種方法無視知識產權。

由於針對多個AI公司的法律案件加劇，Meta可能會面臨壓力要披露有關其培訓數據來源的更多信息，如果法院對公司的規定，AI行業可能會在使用受版權保護的材料之前獲得明確的許可協議，從而重塑了Meta AI之類的模型。

美國和歐洲已經在考慮可能對AI數據採購實施更嚴格的控制權。

Related Posts