AIs ‘Original Sin’: Undersøkelse avslører tech-giganter skrapte millioner av YouTube-videoer for å trene modeller

En fantastisk ny undersøkelse fra Atlanterhavet har avdekket en enorm, uautorisert datafang i kjernen av AI Boom.

Rapporten viser at tech-giganter som Meta, Microsoft og Nvidia har

et spørsmål om skala og samtykke

Skalaen på datainnsamlingen er svimlende. Undersøkelsen identifiserte minst 13 forskjellige datasett som ble brukt av A Who of Big Tech, inkludert Amazon, Bytedance, Snap og Tencent. Dette bekrefter tidligere rapporter om skraping av firmaer som Apple og Anthropic.

Denne masse nedlastingen krenker YouTubes tjenestevilkår, men den har fortsatt fortsatt ikke merket av. For skaperne er nyhetene et dypt svik.

[innebygd innhold]

Woodworker Jon Peters, hvis kanal var blant de skrapede, fanget følelsen av hjelpeløshet, og spurte:”Jeg tror alt kommer til å bli stjålet…”Problemet handler ikke bare om copyright, men om den grunnleggende rettferdigheten i et økosystem der skapernes arbeid høstes for å bygge sine direkte konkurrenter.

YouTube’s Tightrope Walk

fanget i midten, har YouTube rullet ut en serie med reaktive mål. I desember 2024 introduserte plattformen en ny innstilling som lar skaperne melde seg inn i tredjeparts AI-trening. Avgjørende er at denne kontrollen er av som standard, og legger byrden av samtykke til AI-firmaer.

Dette fulgte tidligere oppdateringer rettet mot åpenhet og beskyttelse. I september 2024 begynte YouTube å styrke sitt innholds-ID-system for å oppdage AI-genererte ansikter og stemmer. En måned senere introduserte den en”fanget med et kamera”-etikett for å bekrefte autentiske opptak.

Imidlertid tar ikke disse verktøyene et kjerneproblem: Google fortsetter selv å bruke YouTube-innhold for å trene sine egne modeller, som Veo 3. Dette policyen fremhever en vanskelig interessekonflikt for plattformen som det å tjene begge skaperne og dets foreldre Company A-ambisjon. Battlefield

Bransjens”skrap først, spør senere”tilnærming står nå overfor en lovlig regning. Søksmål øker, med skapere som David Millette som saksøker Nvidia og Openai for urettferdig berikelse og urettferdig konkurranse om bruken av videoene sine.

Disse individuelle draktene er en del av en større juridisk krig mot en bransje bygget på et fundament av masse, ikke-kreditert datainntak. Denne konflikten har eskalert til høye innsatser.

I en landemerke-sak anla Disney og Universal et feiende søksmål mot AI Lab Midjourney, og anklaget den for å bygge sine modeller for stjålet åndsverk. Disneys generaladvokat, Horacio Gutierrez, hakket ingen ord, og sa:”Piratkopiering er piratkopiering. Og det at det gjøres av et A.I.-selskap gjør det ikke mindre krenkende.”

Den mest kritiske testen av”rettferdig bruk”-læren er imidlertid utfoldet seg i en San Francisco Courtroom. AI-firmaet Anthropic gikk nylig med på en rekord på 1,5 milliarder dollar oppgjør med bokforfattere over bruken av opphavsrettsbeskyttede verk-en avtale hyllet som AI-bransjens”Napster Moment.”Men i en fantastisk vending har bosettingsgodkjenningen blitt satt i fare.

U.S. Distriktsdommer William Alsup sprengte forslaget som”ingen steder nær fullført”, og satte hele avtalen i fare. Hans skepsis stammer fra en tidligere kjennelse der han skilte handlingen med AI-trening fra datainnsamling.

Mens han kalte dens AI-modeller”typisk transformativ”, fordømte han Antropics bruk av piratkopierte bøker fra”Shadow Libraries”som en”original synde”som utgjorde den. Denne rettslige granskningen har kastet saken, og bransjens juridiske strategi, inn i kaos.

Med oppgjøret på vent, står antropisk igjen en potensiell rettssak som kan føre til katastrofale skader. Når domstolene begynner å trekke en skarp linje mellom transformativ teknologi og direkte data piratkopiering, begynner den juridiske bakken under den generative AI-boom å se stadig ustabil ut.

Et våpenløp drevet av skaperinnholdet

Det hektiske datafanget er drevet av et Fierce “Ai Arms race. Bedrifter skjenker milliarder i å utvikle generative verktøy for tekst, bilder og video og treningsdata av høy kvalitet er det essensielle drivstoffet. Målet er å fange et marked anslått til å være verdt over 2,5 milliarder dollar innen 2032.

Google har aggressivt rullet ut Veo 3-modellen, som kan generere video med synkronisert lyd, til abonnementsnivåene. Google DeepMind-administrerende direktør Demis Hassabis erklærte:”Vi kommer ut fra den stille epoken med videoregenerering,”signaliserer de høye innsatsen. I mellomtiden motarbeidet Microsoft ved å tilby Openais mektige Sora-modell gratis.

Even Meta, etter interne tilbakeslag, svingte til lisensiering av Midjourneys teknologi for å holde tritt. Denne konkurransedyktige vanviddet understreker hvorfor skaperinnholdet er så verdifullt. Det gir den enorme, mangfoldige og høykvalitets råstoff som er nødvendig for å bygge neste generasjon AI, uavhengig av opprinnelse.

Categories: IT Info

AIs ‘Original Sin’: Undersøkelse avslører tech-giganter skrapte millioner av YouTube-videoer for å trene modeller

Published by All Things Windows on September 11, 2025

et spørsmål om skala og samtykke

YouTube’s Tightrope Walk

Et våpenløp drevet av skaperinnholdet

IT Info

FTC lanserer stor sonde inn i AI chatbot-sikkerhet for tenåringer, og målretter Google, Meta og Openai

IT Info

Meta utvider Community Notes, vil nå varsle brukere som samhandlet med korrigerte innlegg

IT Info

Hvordan aktivere tilfeldige maskinvareadresser i Windows 11 (Mac Randomization)

AIs ‘Original Sin’: Undersøkelse avslører tech-giganter skrapte millioner av YouTube-videoer for å trene modeller

Published by All Things Windows on September 11, 2025

et spørsmål om skala og samtykke

YouTube’s Tightrope Walk

Et våpenløp drevet av skaperinnholdet

Related Posts

IT Info

FTC lanserer stor sonde inn i AI chatbot-sikkerhet for tenåringer, og målretter Google, Meta og Openai

IT Info

Meta utvider Community Notes, vil nå varsle brukere som samhandlet med korrigerte innlegg

IT Info

Hvordan aktivere tilfeldige maskinvareadresser i Windows 11 (Mac Randomization)