德國法院裁定 OpenAI 的 ChatGPT 無法複製受版權保護的歌詞,這是一個里程碑式的決定,對生成式 AI 模型的訓練方式提出了挑戰。
今天在慕尼黑做出的一項判決中,慕尼黑第一地區法院站在德國音樂權利組織 GEMA 一邊,裁定 OpenAI 對侵犯版權負有責任。其裁定發現 OpenAI 的模型非法“記憶”並輸出受保護的作品,駁回該公司關於其流程受到文本和數據挖掘法律例外涵蓋的辯護。
建立該裁決是歐洲的重要先例,概述了人工智能開發商在知識產權方面的新責任。作為回應,OpenAI 宣布將對這一裁決提出上訴。
具有里程碑意義的裁決:法院認為 AI“記憶”侵犯版權
在一項對生成 AI 行業產生影響的裁決中,慕尼黑法院發現 OpenAI 直接負責聊天機器人輸出受保護的歌詞時構成版權侵犯。
該案件由 GEMA 代表幾位德國藝術家提起,主要針對九首特定歌曲,包括 Helene Fischer 和 Rolf Zuckowski 的作品。
GEMA,Gesellschaft für musikalische Aufführungs-und mechanische Vervielfältigungsrechte(音樂表演和機械複製協會)的縮寫Rights)是德國版權管理協會,代表作曲家、作詞家和音樂出版商管理音樂版權。
GEMA 辯稱,ChatGPT 能夠生成這些歌詞近乎完美的複製品,證明這些歌詞在其訓練數據中被非法使用。
法律糾紛的核心是法院對“記憶”的解釋。
根據官方新聞稿,法院得出結論,歌詞可複制地包含在模型參數內,這構成版權法下的一種複制形式。這一發現直接反駁了一些人工智能開發人員的說法,即他們的模型學習概念而不是存儲逐字副本。
至關重要的是,法院推翻了 OpenAI 的主要辯護:其活動是在德國文本和數據挖掘 (TDM) 例外下獲得許可的。法院認為,這一法律盾牌是為了分析信息,但當人工智能以損害原始創作者盈利能力的方式複制整個作品時,它並不適用。
“文本和數據挖掘的前提……不影響商業利益……不適用於這個星座,”法院表示。 “相反,模型中的複製品干擾了權利人的使用權。”
法院闡述了TDM例外的前提是後續分析不干擾原作的正常利用。
法院認為OpenAI通過記憶和復制歌詞,創造了與許可歌詞服務直接競爭的替代產品,從而損害了權利人的一級市場。
這一詳細解釋具有重大意義。縮小了德國生成式人工智能的 TDM 防禦的適用範圍。
法官還要求 OpenAI(而非最終用戶)對侵權負責。由於輸出可以通過簡單的提示生成,法院認為 OpenAI 的系統架構是侵權的決定性因素。
不同的法律格局:德國裁決在全球範圍內的比較
在 OpenAI 準備上訴的同時,該裁決又增加了越來越多的國際法律裁決,這些裁決在人工智能和版權問題上沒有達成明確的共識。不同的司法管轄區得出了截然不同的結論,為全球運營的開發者創造了一個複雜且不確定的環境。
在美國,涉及 AI 實驗室 Anthropic 和音樂出版商的類似案件通過和解得到了解決。
Anthropic 同意維持和執行技術“護欄”,以防止其 Claude AI 複製受版權保護的歌詞,而不是法院判決。
美國法律體系的“合理使用”原則,允許出於“變革”目的而未經許可使用受版權保護的材料,是許多此類案件中辯護的核心部分,儘管其在人工智能培訓中的應用仍然是一個激烈爭論且懸而未決的問題。
將音樂案件與單獨的集體訴訟區分開來也很重要,在該集體訴訟中Anthropic 為主張版權的作者設立了 15 億美元的和解基金
與此同時,英國高等法院最近在 Getty Images 和 Stability AI 之間的案件中作出的裁決提供了對開發者更加友好的解釋。
倫敦法院發現人工智能生成的輸出並非基於存儲或複制的作品,因此建議根據英國法律,對受版權保護的材料進行培訓本身並不構成侵權。慕尼黑將“記憶”作為一種複制形式的關注與這一發現形成鮮明對比。
這種分歧凸顯了這些法律鬥爭的高風險。正如馬克斯·普朗克研究所的法律專家 Silke von Lewinski 在判決前指出,此類案件的結果對所有創作者都至關重要。
“這對於所有作品都至關重要,無論是文學、新聞文本、音樂、視覺藝術、攝影還是任何其他作品。用於生成人工智能。”她說。
更廣泛的影響:所有創意產業的先例
雖然慕尼黑的裁決針對的是歌詞,但它向所有創意行業發出了強有力的信號。作者、記者、攝影師和軟件開發人員正在密切關注這些訴訟,因為法律原則同樣適用於他們的工作。
未經許可的培訓是否構成合理使用或侵權仍然是中心戰場。
這種法律上的不確定性延伸到了其他媒體,尤其是新聞業。包括《紐約時報》在內的主要出版商也對 OpenAI 和微軟提起了類似的版權訴訟,稱生成式人工智能工具非法使用其龐大的文章檔案來構建競爭產品。
在這些案件中,人工智能開發人員的損失可能會迫使他們從根本上重新設計他們的商業模式,從而有可能為高質量訓練數據創建一個新的大規模許可市場。
一些人工智能公司正試圖通過主動許可來應對法律挑戰。
確保訓練數據的穩定、合法來源,同時補償創作者是該策略的主要目標。 OpenAI 本身已與《時代》雜誌和美聯社等媒體組織合作,創建了一個在模型訓練中使用其內容的框架。
這些協議表明了潛在的前進道路,可以幫助避免有爭議的訴訟。
然而,由於從網絡上抓取了無數 TB 的現有數據,訴訟仍然是政策的主要驅動力。
德國將密切關注 OpenAI 上訴的結果,其他許多待決案件也是如此。
目前,GEMA 在慕尼黑的勝利極大地推動了權利持有者的主張,他們認為人工智能公司必須對其使用的數據負責。
它強化了這樣一種觀念,即技術進步不能以犧牲既定的知識產權為代價,為進一步的法律和監管對抗奠定了基礎。