Meta Platforms on tiukan oikeudellisen valvonnan alaisena väitetyn laittoman materiaalin käytön Llama AI-mallien koulutuksessa. Toimitusjohtaja Mark Zuckerbergin johtamaa yritystä syytetään luvattomien tietojoukkojen käyttämisestä LibGenistä, joka on tunnettu piraattikirjojen lähde. ja akateemisia artikkeleita.
Äskettäin jätetyt asiakirjat kannetta varten, joka on jätetty Yhdysvaltain Kalifornian pohjoisen piirin piirioikeuteen (asiakirja 1, asiakirja 2) väittää, että Zuckerberg hyväksyi suoraan tietojoukon käyttö huolimatta sisäisistä varoituksista sen laillisuudesta.
Tunnetut kirjailijat, mukaan lukien Sarah Silverman ja Ta-Nehisi Coates on kantajien joukossa väittäen, että Metan toimet rikkovat tekijänoikeuslakia ja Digital Millennium Copyright Act (DMCA).
He väittävät myös, että Californian Comprehensive Computer Data Access and Fraud_Act (CDAFA), joka viittaa torrent-toimintaan ja metatietojen poistamiseen, jotka salasivat tietojen alkuperän./p>
Torrentit ovat peer-to-peer-tiedostonjakotekniikka, jonka avulla käyttäjät voivat ladata tiedostoja pienemmissä osissa useista lähteistä. Vaikka se on tehokas suurten tietojoukkojen jakamiseen, sitä käytetään usein piraattisisällön jakeluun, koska se on hajautettua ja vaikeasti valvottavaa.
Hyväksyntä sisäisistä vastalauseista huolimatta
Sisäiset asiakirjat ja talletukset paljastavat Metan huolestuttavan päätöksentekomallin. Insinöörit ilmaisivat huolensa LibGenin käytöstä, ja yksi sanoi:”Torrentaaminen [Metan omistamasta] yrityksen kannettavasta tietokoneesta ei tunnu oikealta.”
Nämä vastalauseet esitettiin Zuckerbergille, joka lopulta hyväksyi tietojoukon Sisäinen muistio vahvisti:”MZ:lle [Mark Zuckerbergille] siirrettyään Metan tekoälytiimi hyväksyttiin käyttämään LibGeniä.”
Tämä hyväksyntä syntyi, kun Meta pyrki parantamaan Llama-malliensa ominaisuuksia, mikä on kriittinen osa sen strategiaa kilpailla nopeasti kehittyvällä tekoälysektorilla. LibGen-tietojoukkoa käytettiin tiettävästi sekä mallien koulutukseen että hienosäätöön, mikä tarjosi laajamittaista dataa, jota tarvitaan kielenkäsittelyominaisuuksien kehittämiseen.
Torrentointi ja metatietojen poistaminen
Oikeusjuttu syyttää Metaa torrenting-protokollien käyttämisestä LibGen-tietojoukon käyttämiseen ja jakeluun. Torrentointiin sisältyy luonnostaan ”kylvöinti”tai ladatun sisällön osien jakaminen muiden käyttäjien kanssa.
Todistusten mukaan Meta-insinöörit määrittelivät torrentia koskevat asetukset minimoimaan näkyvyyttä. Kuten oikeuskäsittelyssä todettiin,”Bashlykov määritti [torrentin”]-asetuksissa, jotta pienin mahdollinen kylvömäärä voisi tapahtua”, yrittää välttää havaitsemisen, vaikka se on edelleen tiedostonjakoverkkoa.
Torrentin lisäksi Metan kerrotaan poistaneen Tekijänoikeuksien hallinnan Tiedot (CMI) harjoitustietojoukoista. CMI sisältää tekijänoikeudella suojattuihin teoksiin liitetyt metatiedot, jotka sisältävät tietoja, kuten tekijän nimen, julkaisupäivämäärän ja lisenssitiedot. CMI:n poistaminen on DMCA:n mukaan laitonta, jos se helpottaa tekijänoikeusrikkomusta.
Kantajat väittävät, että tämä poisto oli tahallinen teko hämärtää tietojoukon alkuperä ja estää Llama-malleja tuottamasta tunnistettavaa tekijänoikeudella suojattua sisältöä.
Kuten kanteessa todetaan,”Meta riisui CMI:n paitsi koulutustarkoituksiin, myös piilottaakseen tekijänoikeusrikkomuksensa, koska tekijänoikeudella suojattujen teosten poistaminen estää Llamaa lähettämästä tekijänoikeustietoja, jotka saattavat varoittaa Llaman käyttäjiä ja yleisöä Metan loukkaus.”
Yann LeCun, Metan johtava tekoälytutkija, antoi viime vuonna vihjeen, kuinka Meta pohtii tekijänoikeudella suojattua materiaalia ehdottaessaan X:ssä (entinen Twitter), että kirjantekijöiden tulisi saattaa teoksensa vapaasti saataville.
Vain pieni määrä kirjantekijöitä ansaitsee merkittävää rahaa kirjojen myynnistä.
Tämä näyttää viittaavan siihen, että useimpien kirjojen pitäisi olla vapaasti ladattavissa.
Kirjoittajien menetetyt tulot olisivat pieniä ja yhteiskunnan hyöty suuria. https://t.co/4ObkW1tm85— Yann LeCun (@ylecun) 1. tammikuuta 2024
Oikeudelliset ja eettiset vaikutukset
Metaa vastaan esitettyihin oikeudellisiin argumentteihin kuuluvat DMCA:n mukaiset vaatimukset CMI:n ja CDAFA:n poistamisesta laittomasti saatavien tietojen saamiseksi ja käyttämiseksi tietoja ilman lupaa. Kantajat väittävät, että Metan torrentit ja metatietojen poisto olivat olennainen osa sen tekijänoikeudella suojatun materiaalin käytön salailua.
Tapausta valvova tuomari Vince Chhabria kritisoi Metan yrityksiä muokata merkittäviä osia hakemuksesta ja huomautti:”On selvää, että Metan sinetöintipyyntöä ei ole suunniteltu suojaamaan arkaluonteisten yritystietojen paljastamiselta… , se on suunniteltu välttämään negatiivista julkisuutta.”
Metaa vastaan esitetyt väitteet ovat osa laajempaa keskustelua tekoälymallien kouluttamisesta. Suuret kielimallit, kuten Llama luottaa usein massiivisiin tietokokonaisuuksiin, jotka voivat sisältää tekijänoikeudella suojattua materiaalia.
Vaikka Metan kaltaiset yritykset väittävät, että tällainen käyttö kuuluu reilun käytön piiriin, kriitikot väittävät, että se loukkaa tekijöiden oikeuksia ja korostaa selkeämpien oikeudellisten puitteiden tarvetta. tekoälyn kehityksessä.
Laajempi teollisuuskonteksti
Tämä tapaus ei ole yksittäinen tapaus generatiivisen tekoälyn kehitys on johtanut useisiin oikeusjuttuihin suuria teknologiayrityksiä vastaan, ja tekijät ja tekijänoikeuksien haltijat kyseenalaistavat teostensa käytön laillisuuden ja eettisyyden ilman lupaa.
Metan tapaus kuvastaa laajempaa jännitettä teknologisen innovaation ja immateriaalioikeuksia koskevien lakien välillä. Oikeusjuttu valaisee myös Metan operatiivisia päätöksiä, joissa pyrkimys pysyä kilpailukykyisenä tekoälyssä näytti olevan tärkeämpi kuin eettiset ja oikeudelliset näkökohdat.
Metan käytännöt herättävät kysymyksiä siitä, kuinka yritykset tasapainottavat innovaatioita vaatimustenmukaisuuden ja vastuullisuuden kanssa. Tapaus voi olla ennakkotapaus sille, kuinka tuomioistuimet käsittelevät tekijänoikeudella suojatun materiaalin käyttöä tekoälykoulutuksessa, mikä saattaa vaikuttaa säädöksiin ja alan standardeihin.