訴訟中包含的內部電子郵件表明,員工知道法律風險,但繼續培訓。這些文件還證實,元數據在進行未經批准的數據時停止了許可談判。
提交的備案是美國加利福尼亞州北區地區法院的版權訴訟的一部分,強調了梅塔的AI部門如何辯論該使用。盜版內容。該訴訟是在其數據收集實踐對包括OpenAI和Google在內的AI公司加大法律壓力之後。
新證據表明,梅塔高管表明,包括首席執行官馬克·扎克伯格那個元的工程師和法律團隊對使用受版權保護的書籍進行AI培訓有矛盾的看法。在一次討論中,一名員工建議最好先尋求批准,而不是先採取行動,然後要求寬恕:
“ [m] y的意見是(在’問寬恕,而不是為了許可’):我們試圖獲取書籍並將其升級給執行者,以便他們打電話。”
儘管有風險旨在避免許可協議的成本和限制。
訴訟明確地聲稱,元數據從圖書館獲得了培訓數據(libgen),這是一個著名的在線庫存庫,用於盜版書籍。隨著員工調整設置以減少播種活動,這是通過點對點網絡共享文件時避免檢測的常見方法。
此外,訴訟聲稱Meta故意從其中刪除了版權管理信息(CMI)培訓數據。法院提出的文件指出:
“ Meta剝離了CMI,不僅是出於培訓目的,而且還隱藏了其版權侵權,因為剝離版權所有的作品的CMI可以防止Llama輸出版權信息,從而可能提醒Llama用戶和公眾向公眾提醒。 Meta的侵權。”
這種指控特別嚴重,因為剝離CMI可能會違反《數字千年版權法》(DMCA),如果這樣做是為了掩蓋未經授權使用受版權保護的作品的使用。
法官拒絕梅塔(Meta)隱藏AI培訓詳細信息的企圖
Meta試圖編輯與其AI培訓數據有關的法院文件的部分,但Vince Chhabria法官裁定了對公司的裁定,表示:
“很明顯,元密封請求並非旨在防止披露敏感的業務信息……而是旨在避免宣傳。對AI公司的培訓實踐的司法審查及其不願披露數據來源的審查。法院的決定還與更廣泛的擔憂相吻合,即AI公司正在利用受版權保護的材料,而無需賠償內容創建者。
AI Companies
Meta是在AI培訓數據上面臨法律挑戰,並不是一個人。包括OpenAI和Google在內的其他公司也正在處理作者,出版商和媒體組織的訴訟。這些案例認為,AI生成的產出通常模仿受版權保護的文本,因此無牌培訓違反了知識產權法。
這些備受矚目的案件中的最新案件是印度出版商聯合會(FIP)對OpenAI提起的新版權訴訟,佔印度出版行業的80%以上。 《紐約時報》在針對Microsoft和Openai的新聞內容使用情況下的另一項爭議中。法院現在將確定當前的版權法是否適用於AI培訓或是否需要立法更改。
Meta的AI策略面臨越來越多的審查
AI開發戰略Meta已將Llama作為Openai的GPT等專有模型的開源替代品。但是,最新的訴訟提出了有關該公司是否遵守道德AI實踐的疑問。
Meta的首席AI科學家Yann Lecun先前曾捍衛對書籍和數字知識的無限訪問,認為:
“只有少數圖書作者從書籍銷售中賺了巨大的錢。這似乎表明大多數書都應該可以免費下載。作者的收入損失將很小,相比之下,對社會的收益很大。”
lecun的評論反映了AI開發人員和版權持有人之間正在進行的意識形態鴻溝。一些人主張開放式AI培訓,AI培訓,作者和出版商認為,這種方法無視知識產權。
接下來會發生什麼?
由於針對多個AI公司的法律案件加劇,Meta可能會面臨壓力要披露有關其培訓數據來源的更多信息,如果法院對公司的規定,AI行業可能會在使用受版權保護的材料之前獲得明確的許可協議,從而重塑了Meta AI之類的模型。
美國和歐洲已經在考慮可能對AI數據採購實施更嚴格的控制權。