Një hetim mahnitës i ri nga Atlantiku ka zbuluar një kapje të gjerë, të paautorizuar të të dhënave në thelb të bumit të AI. href=”https://www.theatlantic.com/technology/archive/2025/09/youtube-ai-training-data-set Leja .
Kjo përmbajtje, e skrapuar nga më shumë se 2 milion kanale, është duke u përdorur për të trajnuar modele të fuqishme gjeneruese të videove AI. Praktika ushqen racën e industrisë së teknologjisë për të mbizotëruar valën tjetër të AI. Ai gjithashtu i grumbullon këto firma kundër miliona krijuesve, të cilët tani përballen me një kërcënim ekzistencial. Zbulimet kanë ngjallur reagime të menjëhershme nga krijuesit dhe avokatët e të drejtave, duke përshkallëzuar një debat tashmë të tensionuar mbi të dhënat, të drejtat e autorit dhe pëlqimin në moshën AI. Hetimi identifikoi të paktën 13 grupe të të dhënave të ndryshme të përdorura nga kush është kush i Big Tech, përfshirë Amazon, Bytedance, Snap dhe Tencent. Kjo konfirmon raportet e mëparshme të skrapimit nga firmat si Apple dhe Antropic. Për krijuesit, lajmi është një tradhti e thellë. Ështja nuk ka të bëjë vetëm me të drejtat e autorit, por për drejtësinë themelore të një ekosistemi ku puna e krijuesve është korrur për të ndërtuar konkurrentët e tyre të drejtpërdrejtë. Në Dhjetor 2024, platforma prezantoi një mjedis të ri duke i lejuar krijuesit të zgjedhin në trajnimin e AI të palëve të treta. Në mënyrë thelbësore, ky kontroll është i fikur si parazgjedhje, duke vendosur barrën e pëlqimit në firmat e AI.
Kjo pasoi azhurnimet e mëparshme që synojnë transparencën dhe mbrojtjen. Në Shtator 2024, YouTube filloi të përmirësojë sistemin e tij të ID të përmbajtjes për të zbuluar fytyrat dhe zërat e gjeneruar nga AI. Një muaj më vonë, ajo prezantoi një etiketë”të kapur me një aparat fotografik”për të verifikuar pamjet autentike. Battlefield
“Qasja e parë”e industrisë”Scrape First, Pyesni më vonë”tani po përballet me një llogari ligjore. Procedimet gjyqësore janë në rritje, me krijuesit si David Millette duke paditur Nvidia dhe Openai për pasurim të padrejtë dhe konkurrencë të padrejtë mbi përdorimin e videove të tyre. Ky konflikt është përshkallëzuar në beteja të korporatave me interes të lartë. Këshilltari i Përgjithshëm i Disney, Horacio Gutierrez, i grirë asnjë fjalë, duke thënë,”Pirateria është pirateria. Dhe fakti që është bërë nga një kompani A.I. nuk e bën atë më pak shkelje.”Firma e AI, Antropic kohët e fundit ra dakord për një zgjidhje rekord prej 1.5 miliardë dollarësh me autorët e librave për përdorimin e saj të veprave të mbrojtura nga të drejtat e autorit-një marrëveshje e përshëndetur si”Napster Moment”i industrisë së AI”. Por në një kthesë mahnitëse, miratimi i vendbanimit është rrezikuar.
U.S. Gjykatësi i Qarkut William Alsup shpërtheu propozimin si”askund afër të plotë”, duke vënë në rrezik të gjithë marrëveshjen. Skepticizmi i tij buron nga një vendim i mëparshëm, ku ai ndau aktin e trajnimit të AI nga përvetësimi i të dhënave. Kjo kontroll gjyqësor e ka hedhur çështjen, dhe strategjia ligjore e industrisë, në kaos. Ndërsa gjykatat fillojnë të vizatojnë një linjë të mprehtë midis teknologjisë transformuese dhe piraterisë së të dhënave të drejta, terreni ligjor nën bumin gjenerues të AI ka filluar të duket gjithnjë e më i paqëndrueshëm. Kompanitë po derdhin miliarda në zhvillimin e mjeteve gjeneruese për tekst, imazhe dhe video, dhe të dhënat e trajnimit me cilësi të lartë janë karburanti thelbësor. Qëllimi është të kapni një treg të parashikuar të jetë me vlerë mbi 2.5 miliardë dollarë deri në vitin 2032. Drejtori i Përgjithshëm i Google Deepmind Demis Hassabis deklaroi,”Ne po dalim nga epoka e heshtur e gjenerimit të videos”, duke sinjalizuar aksionet e larta. Ndërkohë, Microsoft kundërshtoi duke ofruar falas modelin e fuqishëm Sora të Openai. Kjo tërbim konkurrues nënvizon pse përmbajtja e krijuesit është kaq e vlefshme. Ajo siguron lëndën e parë të gjerë, të larmishme dhe me cilësi të lartë të nevojshme për ndërtimin e gjeneratës tjetër të AI, pavarësisht nga origjina e tij.