大西洋からの見事な新しい調査により、AIブームの中核で広大で不正なデータグラブが発見されました。 href=”https://www.theatlantic.com/technology/archive/2025/09/youtube-ai-training-data-sets/684116/?gift=zcgkfk1rjjaw1wpfnahahqipm647geaw6jabwthzy_fids”_ fid”_ fid dowdows”許可なしに。
このコンテンツは、200万を超えるチャネルから削り取られ、強力な生成AIビデオモデルをトレーニングするために使用されています。この実践は、AIの次の波を支配するために、ハイテク業界の競争に燃料を供給します。また、これらの企業を何百万人ものクリエイターに対してピットします。これらは現在、実存的な脅威に直面しています。啓示は、クリエイターや権利擁護者からの即時の反発を引き起こし、AIの時代におけるデータ、著作権、および同意に関するすでに緊張した議論をエスカレートしました。この調査では、Amazon、Bytedance、Snap、Tencentなど、Big TechのWHOが使用する少なくとも13の異なるデータセットが特定されました。これにより、Appleや人類のような企業による削り取りに関する以前の報告が確認されています。
この大量ダウンロードは、YouTubeのサービス条件に違反していますが、ほとんどチェックされていません。クリエイターにとって、ニュースは深遠な裏切りです。
木工のジョン・ピーターズは、そのチャンネルが擦り切れた気持ちを捉え、「すべてが盗まれますか?問題は、著作権だけでなく、クリエイターの労働が直接競合他社を構築するために収穫される生態系の基本的な公平性に関するものです。 2024年12月、このプラットフォームは新しい設定を導入し、クリエイターがサードパーティのAIトレーニングにオプトインできるようにしました。重要なことに、このコントロールはデフォルトでオフになっており、AI企業に同意の負担をかけます。
これは、透明性と保護を目的とした以前の更新に続きました。 2024年9月、YouTubeはコンテンツIDシステムの強化を開始し、AIが生成された顔と声を検出しました。 1か月後、本物の映像を検証するために「カメラでキャプチャされたカメラ」ラベルを導入しました。
これらのツールはコアの問題に対処しません。Google自体は、VEO 3のように独自のモデルをトレーニングするためにYouTubeコンテンツを使用し続けています。戦場
業界の「最初にこすり、後で質問する」アプローチは、法的計算に直面しています。デビッド・ミレットのようなクリエイターは、ビデオの使用をめぐる不当な濃縮と不公平な競争のために、デビッド・ミレットのようなクリエイターがNvidiaやOpenaiを訴えています。この紛争は、ハイステークスの企業の戦いにエスカレートしました。
画期的なケースでは、ディズニーとユニバーサルはAIラボのミッドジャーニーに対して抜本的な訴訟を起こし、盗まれた知的財産にモデルを構築したと非難しました。ディズニーのゼネラルカウンセルであるHoracio Gutierrezは、「著作権侵害は著作権侵害であるという事実は、A.I.の会社によって行われているという事実を侵害するものではありません。」
「フェアユース」の最も重要なテストは、サンフランシスコのクワートルームで展開されています。 AI企業の人類は最近、AI業界の「Napster Moment」として歓迎された著作権のある作品の使用について、本の著者との記録的な15億ドルの和解に同意しました。しかし、驚くべき方向に、和解の承認は危険にさらされています。
米国。地区裁判官のウィリアム・アルスップは、提案を「完成に近い場所」と非難し、契約全体を危険にさらした。彼の懐疑論は、AIトレーニングの行為をデータ収集から分離した以前の判決から生じています。この司法の精査により、訴訟と業界の法的戦略が混chaosに投げ込まれました。裁判所が変革的な技術と完全なデータ著作権侵害の間に鋭い境界線を引き出し始めると、生成的なAIブームの下の法的根拠はますます不安定に見え始めています。企業は、テキスト、画像、ビデオの生成ツールの開発に数十億を注ぎ込んでおり、高品質のトレーニングデータが不可欠な燃料です。目標は、2032年までに25億ドルを超える価値があると予測される市場を獲得することです。
Googleは、同期オーディオを使用してビデオを生成できるVEO 3モデルをサブスクリプション層に積極的に展開しました。 Google DeepmindのCEOであるDemis Hassabisは、「私たちはビデオ生成の静かな時代から浮上している」と宣言し、高い利害関係を示しています。一方、Microsoftは、Openaiの強力なSORAモデルを無料で提供することで反論しました。この競争の激しい狂乱は、なぜクリエイターコンテンツがとても価値があるのかを強調しています。それは、その起源に関係なく、次世代のAIを構築するために必要な広大で多様で高品質の原料を提供します。