Microsoft と OpenAI は、ニューヨーク タイムズやその他の出版社からの著作権侵害の申し立てに直面しており、火曜日、連邦裁判所で、大規模言語モデル (LLM) をトレーニングするために公開されているニュース記事を使用することはフェアユースに基づいて合法であると主張しました。教義。
訴訟は2023年12月に提出され、現在はニューヨーク・デイリー・ニュースと調査報告センターからの同様の主張と統合されており、ChatGPTやMicrosoft CopilotなどのAIシステムが著作権で保護された情報を利用していると主張している。
原告らは、数百万の記事を含むデータセットでトレーニングされたこれらの AI モデルは、元の著作物に代わる方法でコンテンツを複製または要約できると主張しています。 。 「これはコンテンツを変換することではなく、置き換えることです」とニューヨーク・タイムズの代表イアン・クロスビー氏は述べた。
クロスビー氏は、このような行為により、オンライン ニュースのトラフィックの 30% から 50% が出版社のニュースからそらされる可能性があると警告しました。
訴訟の中心となるフェアユース原則
OpenAI の弁護は、ニュース データの使用が変革的であるため、次のような方法で保護されているという主張にかかっています。 OpenAIの弁護士であるジョセフ・グラッツ氏はシドニー・スタイン判事に対し、ChatGPTはデータをトークンと呼ばれる小さな単位に分割することでデータを処理し、モデルが直接複製するのではなくパターンを認識して新しいコンテンツを生成できるようにしていると説明した。
OpenAI の弁護士であるジョセフ・グラッツ氏は、ChatGPT の動作方法に関して、記事全体を逆流するのは「仕様ではないし、機能ではない」と述べ、著作権で保護された資料に似た出力が頻繁に行われると主張した。
マイクロソフトの法務チームはこれらの主張を支持し、AI トレーニングと、VCR やコピーなどの初期の技術革新との類似点を指摘しました。当初は争われていたものの、最終的には合法とみなされたマシン。
彼らは、フェアユースにより、コンテンツ作成者の権利を損なうことなく、社会に利益をもたらすテクノロジーの開発が可能になると主張しました。 「著作権法は、VCR (または自動ピアノ、コピー機、パソコン、インターネット、検索エンジン) に対する障害と同様に、LLM にとって障害ではありません。」と同社は裁判所への提出文書で述べています。
出版社は経済的および倫理的損害を主張
出版社は、コンテンツの無許可使用は著作権法に違反するだけでなく、財務上の持続可能性を脅かすと主張しています。 AI ツールは記事を要約したり、パブリッシャーのペイウォールを回避する製品の推奨を提供したりする。
タイムズ紙によると、Microsoft の Bing Chat (現在は Copilot にブランド変更) は、潜在的な読者を アフィリエイト プラットフォーム Wirecutter がトラフィックと収益を減少させている。
ニューヨーク デイリー ニュースの代表スティーブン リーバーマン氏はこう批判した。テクノロジー企業は、公共利用のために Web データを集約する非営利団体である Common Crawl などの情報源に依存しています。同氏は、この慣行はジャーナリストや出版社の仕事に「ただ乗り」しているものであり、AI 企業が自分たちが作成またはライセンスを取得していないコンテンツを収益化できるようにしていると説明しました。
OpenAI は、このアプローチによりデータへのアクセスが民主化されると主張していますが、批評家はこう指摘しています。
問題をさらに悪化させるのは、OpenAI がリアルタイム情報を統合する手法である検索拡張生成 (RAG) を使用していることです。この技術により、出力の関連性と正確性が向上しますが、パブリッシャーのコンテンツがどのようにアクセスされ、複製されるかについて疑問が生じます。
一か八かのリスク: データセットの破壊の可能性と、金銭的罰金
この訴訟は数十億ドルの損害賠償を求めており、不正な素材を含むデータセットの破棄を求めているが、このような判決はOpenAIとMicrosoftに重大な影響を与え、再建を強いられる可能性がある。 AI システムは、ライセンスされたコンテンツまたはパブリック ドメインのコンテンツのみを使用します。
連邦著作権法では、故意の侵害ごとに最大 150,000 ドルの罰金が認められています。、関係するデータ量を考慮すると、この数字は劇的に増加する可能性があります。
メディア マネージャー ツールと業界の対応の遅れ
訴訟また、OpenAI が自社のコンテンツが AI トレーニング データセットでどのように使用されるかをより詳細に制御できるようにするため、2024 年 5 月に当初約束されていた Media Manager ツールの展開が遅れたことに対する不満も強調しています。
批評家は、この失敗により、小規模の出版社や独立系クリエイターには知的財産を保護するための選択肢が限られたままになっていると主張しています。
TIME、The New Yorker、Vogue、Vanity Fair、Bon Appetit、Wired などの大手出版社やその他 200 社以上の出版社が OpenAI とライセンス契約を結んでいますが、多くの小規模企業は同様の契約を交渉するためのリソースが不足しています。.
業界全体では依然として分裂が続いており、一部の企業は AI 開発用のコンテンツのライセンス供与に提携を受け入れている一方、他の企業は訴訟を進めています。カナダでは、出版社連合が OpenAI を「広範なスクレイピング」として告発し訴訟を起こしており、マイケル・シェイボンのような著名な作家も同様の懸念を表明している。
裁判官、却下申し立てに対する判決
シドニー・スタイン判事は公聴会で技術的な問題について強い理解を示したが、被告の却下申し立てに対してまだ判決を下していない。
スタイン氏は訴訟の複雑さを認め、今回の結果は生成 AI システムが著作権で保護された素材とどのように相互作用するか、またコンテンツ作成者に対する開発者の義務について重要な前例となる可能性があると述べた。
訴訟が進むにつれ、この訴訟の影響は OpenAI とマイクロソフトをはるかに超えて広がり、イノベーションとパブリッシャーやクリエイターの権利のバランスをとり、生成 AI の未来を形作る可能性があります。