A Meta Platforms intenzív jogi ellenőrzés alatt áll a Llama AI modelljei képzése során kalóz anyagok állítólagos felhasználása miatt. A Mark Zuckerberg vezérigazgató által vezetett céget azzal vádolják, hogy a LibGen-tól, egy jól ismert kalózkönyv-forrástól származó adatkészleteket használt fel. és tudományos cikkek.
Az Egyesült Államok Kalifornia északi körzetének kerületi bíróságán benyújtott keresethez benyújtott újonnan benyújtott dokumentumok (1. dokumentum, 2. dokumentum) azt állítják, hogy Zuckerberg közvetlenül jóváhagyta az adatkészletet használata, annak ellenére, hogy belső figyelmeztetések voltak a törvényességgel kapcsolatban.
Kiemes szerzők, köztük Sarah Silverman és Ta-Nehisi Coates a felperesek között van, azzal érvelve, hogy a Meta lépései sértik a szerzői jogi törvényt és a Digital Millennium Copyright Act (DMCA).
Azt is állítják, hogy megsértették a következőt: Kalifornia átfogó számítógépes adatokhoz való hozzáféréséről és csalásáról szóló törvénye (CDAFA), amely torrentezési tevékenységekre és metaadat-leválasztásra mutat rá, amely elrejtette az adatok eredetét<./p>
A torrentek egy peer-to-peer fájlmegosztó technológia, amely lehetővé teszi a felhasználók számára, hogy kisebb szegmensekben töltsenek le fájlokat több forrásból. Bár hatékony nagy adathalmazok megosztására, gyakran használják kalóz tartalmak terjesztésére, mivel decentralizált és nehezen ellenőrizhető.
Kapcsolódó: A Meta elismeri, hogy az ausztrál Facebook felhasználói adatait megérinti AI-hoz Képzés beleegyezés nélkül
Belső kifogások ellenére jóváhagyás
A belső dokumentumok és beadványok aggasztó mintát mutatnak döntéshozatal a Metánál. A mérnökök aggodalmuknak adtak hangot a LibGen használatával kapcsolatban, és az egyik kijelentette: „A [Meta tulajdonában lévő] vállalati laptopról való torrentezés nem megfelelő.”
Ezeket a kifogásokat Zuckerberghez továbbították, aki végül jóváhagyta az adatkészletet Egy belső feljegyzés megerősítette: „Az MZ-hez [Mark Zuckerberg] való eszkalációt követően a Meta mesterséges intelligencia csapata jóváhagyást kapott a LibGen használatára.”
Ez a jóváhagyás akkor történt, amikor a Meta igyekezett fokozni Llama modelljei képességeit, ami kritikus része annak a stratégiájának, hogy versenyezzen a gyorsan fejlődő mesterséges intelligencia szektorban. A LibGen adatkészletet állítólag a modellek betanítására és finomhangolására is használták, biztosítva a nyelvi feldolgozási képességek fejlesztéséhez szükséges nagyszabású adatokat.
Kapcsolódó: A felhasználók elhagyják a Facebookot, Instagram, szálak Zuckerberg tényellenőrzési visszafordítása után
Torrentelés és metaadatok eltávolítása
A per azzal vádolja a Metát, hogy torrentezési protokollokat használ a LibGen adatkészlet eléréséhez és terjesztéséhez. A torrentezés magától értetődően magában foglalja a”kivetést”vagy a letöltött tartalom egy részének megosztását más felhasználókkal.
A tanúvallomások szerint a Meta mérnökei úgy konfigurálták a torrentezési beállításokat, hogy minimálisra csökkentsék a láthatóságot. Amint az a bírósági beadványban is szerepel, „Bashlykov konfigurálta a [torrentet ] beállításokat, így a lehető legkisebb mennyiségű oltás történhet”, ezzel próbálja elkerülni az észlelést, miközben továbbra is részt vesz a fájlmegosztó hálózatban.
In A torrentezés mellett a Meta állítólag megfosztotta a szerzői jogkezelést Információk (CMI) a betanítási adatkészletekből. A CMI tartalmazza a szerzői joggal védett művekhez csatolt metaadatokat, amelyek olyan részleteket tartalmaznak, mint a szerző neve, megjelenési dátuma és licencinformációk. A CMI eltávolítása a DMCA értelmében illegális, ha elősegíti a szerzői jogok megsértését.
A felperesek azzal érvelnek, hogy ez az eltávolítás szándékos intézkedés volt az adatkészlet eredetének elhomályosítására, és megakadályozza, hogy a Llama modellek azonosítható, szerzői joggal védett tartalmat adjanak ki.
Amint a kereset is kimondja: „A Meta nem csak képzési célból eltávolította a CMI-t, hanem azért is, hogy elrejtse a szerzői jogok megsértését, mivel a szerzői joggal védett művek CMI-jének eltávolítása megakadályozza, hogy a Llama olyan szerzői jogi információkat közöljön, amelyek figyelmeztethetik a Llama felhasználókat és a közvéleményt. A Meta jogsértése.”
Yann LeCun, a Meta vezető mesterséges intelligencia tudósa tavaly adott egy tippet, hogyan Meta a szerzői jog által védett anyagokra gondol, amikor azt javasolta az X-en (korábban Twitter), hogy a könyvszerzők tegyék szabadon elérhetővé műveiket.
Csak kevés könyvszerző keres jelentős pénzt könyveladásokból.
Ez azt sugallja, hogy a legtöbb könyvnek szabadon letölthetőnek kell lennie.
A szerzők bevételkiesése kicsi lenne, és ehhez képest a társadalom számára nagy haszna lenne href=”https://t.co/4ObkW1tm85″>https://t.co/4ObkW1tm85– Yann LeCun (@ylecun) január 1. 2024
Jogi és etikai következmények
A Meta elleni jogi érvek között szerepel a DMCA alapján a CMI és a CDAFA eltávolítására vonatkozó követelések a kalóz hozzáférés és használat miatt adatok engedély nélkül. A felperesek azt állítják, hogy a Meta torrentezése és metaadatok eltávolítása a szerzői jog által védett anyagok felhasználásának eltitkolásának szerves részét képezte.
Az ügyet felügyelő Vince Chhabria bíró bírálta Meta azon próbálkozásait, hogy a beadvány jelentős részét lektorálja, és megjegyezte: „Nyilvánvaló, hogy a Meta lezárási kérelmének célja nem az érzékeny üzleti információk nyilvánosságra hozatala elleni védelem… , úgy tervezték, hogy elkerülje a negatív nyilvánosságot.”
A Metával szembeni vádak egy szélesebb körű, az AI-modellek képzéséről szóló beszélgetés részét képezik. A nagy nyelvi modellek, mint pl. A Llama gyakran támaszkodik hatalmas adatkészletekre, amelyek szerzői joggal védett anyagokat tartalmazhatnak.
Míg az olyan cégek, mint a Meta, azzal érvelnek, hogy az ilyen felhasználás méltányos használat alá tartozik, a kritikusok szerint ez sérti az alkotók jogait, és rávilágít a világosabb jogi keretek szükségességére. a mesterséges intelligencia fejlesztésében.
Tágabb iparági kontextus
Ez az eset nem elszigetelt esemény A generatív mesterséges intelligencia fejlesztése számos perhez vezetett a nagy technológiai cégek ellen, az alkotók és a szerzői jogok tulajdonosai megkérdőjelezik műveik hozzájárulás nélküli felhasználásának jogszerűségét és etikusságát.
A Meta esete a technológiai innováció és a szellemi tulajdonjog közötti tágabb feszültséget tükrözi. A per a Metán belüli operatív döntésekre is rávilágít, ahol a mesterséges intelligencia versenyképességének megőrzésére irányuló törekvés látszólag felülmúlta az etikai és jogi megfontolásokat.
A Meta gyakorlata kérdéseket vet fel azzal kapcsolatban, hogy a vállalatok hogyan egyensúlyozzák meg az innovációt a megfeleléssel és az elszámoltathatósággal. Az eset precedenst teremthet arra vonatkozóan, hogy a bíróságok hogyan kezelik a szerzői jog által védett anyagokat a mesterséges intelligencia képzése során, ami potenciálisan befolyásolja a szabályozásokat és az iparági szabványokat.