Eine atemberaubende neue Untersuchung des Atlantik href=”https://www.theatlantic.com/technology/archive/2025/09/youtube-ai-training-data-sets/684116/?gift=zcgkfk1rjjaw1wpfnahqipm647geaw6jabwkfk1rjjws”Ziel”Ohne Erlaubnis . Die Praxis treibt das Rennen der Tech-Industrie an, die nächste KI-Welle zu dominieren. Es stellt auch diese Firmen gegen Millionen von Schöpfer, die jetzt einer existenziellen Bedrohung ausgesetzt sind. Die Enthüllungen haben sofortige Gegenreaktionen von Schöpfer und Rechtsanwälten ausgelöst und eine bereits angespannte Debatte über Daten, Urheberrechte und Zustimmung im Alter von AI. Die Untersuchung identifizierte mindestens 13 verschiedene Datensätze, die von einem WHO IS WHO von Big Tech verwendet wurden, einschließlich Amazon, Bytedance, Snap und Tencent. Dies bestätigt frühere Berichte über Scraping durch Unternehmen wie Apple und Anthropic. Für Schöpfer sind die Nachrichten ein tiefgreifender Verrat. Das Problem geht nicht nur um das Urheberrecht, sondern um die grundlegende Fairness eines Ökosystems, in dem die Arbeit der Schöpfer für den Bau ihrer direkten Konkurrenten geerntet wird. Im Dezember 2024 führte die Plattform eine neue Einstellung ein, mit der die Ersteller sich für das KI-Training von Drittanbietern anmelden. Entscheidend ist, dass diese Kontrolle standardmäßig nicht mehr abfällt, was die Einwilligung der KI-Firmen belastet. Im September 2024 begann YouTube, sein Content-ID-System zur Erkennung von Gesichtern und Stimmen von AI-generierten Stimmen zu verbessern. Einen Monat später führte es ein mit einer Kamera erfasster Label ein, um authentisches Filmmaterial zu verifizieren. Battlefield
Der Ansatz „Scrape, Scrape, Scrape, Scrape, Ask später“ steht nun vor einer rechtlichen Abrechnung. Klagen sind zunehmend, wobei Schöpfer wie David Millette Nvidia und Openai wegen ungerechtfertigter Anreicherung und unfairer Wettbewerb um die Verwendung ihrer Videos verklagen. Dieser Konflikt hat sich in Unternehmenskämpfe mit hohen Einsätzen eingebaut. Der General Counsel von Disney, Horacio Gutierrez, minderte keine Worte und besagte:”Piraterie ist Piraterie. Und die Tatsache, dass es von einem A.I.-Unternehmen durchgeführt wird, macht es nicht weniger verletzt.”Die KI-Firma Anthropic stimmte kürzlich einer Rekordvereinbarung von 1,5 Milliarden US-Dollar mit Buchautoren über die Verwendung von urheberrechtlich geschützten Werken zu-ein Deal, der als „Napster-Moment der KI-Branche“ gefeiert wurde. Aber in einer atemberaubenden Kurve wurde die Zustimmung der Siedlung gefährdet. Der Bezirksrichter William Alsup sprengte den Vorschlag als „nicht annähernd bei der vollständigen“ und stimmte die gesamte Vereinbarung in Gefahr. Seine Skepsis beruhte auf einer früheren Entscheidung, bei der er den Akt des KI-Trainings von der Datenerfassung trennte. Diese gerichtliche Prüfung hat den Fall und die rechtliche Strategie der Branche ins Chaos verworfen. Wenn Gerichte eine scharfe Grenze zwischen transformativer Technologie und vollständiger Datenpiraterie ziehen, sieht der Rechtsgrund unter dem generativen AI-Boom immer instabiler aus. Unternehmen gießen Milliarden in die Entwicklung generativer Tools für Text, Bilder und Video ein, und hochwertige Trainingsdaten sind der essentielle Kraftstoff. Ziel ist es, einen Markt zu erfassen, der bis 2032 einen Wert von über 2,5 Milliarden US-Dollar prognostiziert. Der CEO von Google DeepMind, DeC-CEO von Hassabis, erklärte:”Wir entstehen aus der stillen Ära der Videogenerierung”und signalisiert die hohen Einsätze. In der Zwischenzeit stellte Microsoft das leistungsstarke Sora-Modell von OpenAI kostenlos kontert. Dieser wettbewerbsfähige Wahnsinn unterstreicht, warum der Inhalt des Erstellers so wertvoll ist. Es bietet den riesigen, vielfältigen und hochwertigen Rohstoff, der für den Bau der nächsten Generation von KI erforderlich ist, unabhängig von seinem Ursprung.