Μια νέα ακαδημαϊκή μελέτη έχει παραδώσει μια βόμβα για τη βιομηχανία τεχνητής νοημοσύνης, αποκαλύπτοντας ότι το μοντέλο LLAMA 3.1 της Meta έχει απομνημονεύσει αποτελεσματικά και μπορεί να αναπαράγει σχεδόν το ήμισυ του πρώτου βιβλίου του Χάρι Πότερ. Η έρευνα παρέχει τα πιο συγκεκριμένα αποδεικτικά στοιχεία μέχρι σήμερα ότι η κατάργηση της κατάρρευσης υλικού που προστατεύεται από πνευματικά δικαιώματα δεν είναι μια «περιθωριακή συμπεριφορά», όπως ισχυρίζονται ορισμένα εργαστήρια AI, αλλά ένα σημαντικό χαρακτηριστικό ορισμένων μοντέλων που εκπαιδεύονται σε δημοφιλές περιεχόμενο. Αυτό το εύρημα αμφισβητεί άμεσα έναν βασικό πυλώνα της νομικής υπεράσπισης της βιομηχανίας AI σε έναν αυξανόμενο αριθμό αγωγών πνευματικών δικαιωμάτων υψηλού σταδίου. 3.1 Το μοντέλο 70B θα μπορούσε να ανακαλέσει ένα εκπληκτικό 42% του Χάρι Πότερ και της πέτρας του Μάγου. Αυτό αντιπροσωπεύει μια δραματική αύξηση από το 4,4% που απομνημονεύεται από τον προκάτοχό του, LLAMA 1, υποδεικνύοντας ότι οι πιο πρόσφατες μεθόδους κατάρτισης της Meta ενίσχυαν σημαντικά την τάση του μοντέλου να διατηρούν και να αναπαράγουν μόνο τα περιεχόμενα των μοντέλων. Έργα. Οι ερευνητές διαπίστωσαν ότι το ίδιο μοντέλο LLAMA 3.1 απομνημονεύσει μόνο το 0,13% του Sandman Slim, ενός μυθιστορήματος του Richard Kadrey, ο οποίος συμβαίνει να είναι επικεφαλής ενάγοντος σε αγωγή κατηγορίας-δράσης κατά του Meta. This variability—where extremely popular books are heavily memorized while most others are not—could complicate efforts to certify broad class-action lawsuits while simultaneously providing powerful evidence for individual copyright holders.

The Model Itself as an Infringing Copy

The debate over AI and copyright is rapidly evolving beyond whether a model’s output is infringing to whether the model itself αποτελεί παράνομο αντίγραφο. Η νέα μελέτη ενισχύει το τελευταίο επιχείρημα. Ο καθηγητής και ο συν-συγγραφέας του νόμου του Stanford Mark Lemley δήλωσε ότι τα ευρήματα υποδηλώνουν ότι το μοντέλο περιέχει αυτό που «ο νόμος θα αποκαλούσε αντίγραφο μέρους του βιβλίου στο ίδιο το μοντέλο». Σε ένα 108-page αναφορά Το επιχείρημα”ότι τα εσωτερικά βάρη ενός μοντέλου μπορούν να θεωρηθούν ότι παραβιάζουν αντίγραφα εάν το μοντέλο μπορεί να αναπαράγει”ουσιαστική προστατευτική έκφραση”από τα δεδομένα κατάρτισης. Πόλεμος

Αυτές οι εξελίξεις προσγειώνονται, καθώς το meta έχει ήδη βυθιστεί σε νομικές μάχες για την προμήθεια των δεδομένων του. Οι καταθέσεις του δικαστηρίου από νωρίτερα φέτος αποκάλυψαν ότι η εταιρεία φέρεται να χρησιμοποίησε τεράστιες συλλογές πειρατικών βιβλίων από”βιβλιοθήκες σκιών”όπως ο Libgen για να εκπαιδεύσει τα μοντέλα της Llama. Η ανησυχία ενός μηχανικού έγινε δημόσια μέσω των αρχείων:”Το Torrenting από ένα μετα-ιδιοκτησιακό εταιρικό φορητό υπολογιστή δεν αισθάνεται σωστό.”

Οι νόμιμοι κίνδυνοι επιδεινώνονταν με μια ανάλυση εμπειρογνωμόνων που υποδηλώνουν ότι ο Meta μπορεί να έχει συμμετάσχει στην ψηφιακή πειρατεία με επαναφορτίες ή”σπορά”. Υλικό που προστατεύεται από πνευματικά δικαιώματα για εκπαίδευση”δίκαιης χρήσης”για την ενεργό διανομή του. Οι νομικές προκλήσεις είναι επίσης παγκόσμιες, με τους Γάλλους εκδότες και τους συγγραφείς να καταθέτουν παρόμοια αγωγή εναντίον του Meta για αυτό που χαρακτήρισαν”μνημειώδη λεηλασία”.

Αυτός ο αγώνας επεκτείνεται τώρα σε όλη τη βιομηχανία AI, με τη Disney και την Universal να καταθέτουν πρόσφατα μια αγωγή ορόσημο εναντίον της AI Image Generator Midjourney. Όπως ο γενικός σύμβουλος της Disney, Horacio Gutierrez, δήλωσε στους The New York Times,”η πειρατεία είναι η πειρατεία και το γεγονός ότι γίνεται από μια εταιρεία A.I. δεν κάνει λιγότερο παραβιάσεις.”

Η εταιρεία έχει μάθει μια σοβαρή αποχέτευση ταλέντων-έχοντας χάσει 11 από τους 14 αρχικούς συγγραφείς του θεμελιώδους ερευνητικού εγγράφου Llama-και αντιμετωπίζει σημαντικά εμπόδια ανάπτυξης. Το πιο φιλόδοξο μοντέλο του, η παράμετρος 2 τριμήνων Llama 4″Behemoth”, αναβλήθηκε πρόσφατα μέχρι τουλάχιστον τα τέλη του 2025 εν μέσω αγώνων απόδοσης. Σε μια δραματική κίνηση, η Meta ολοκλήρωσε μια επένδυση 14 δισεκατομμυρίων δολαρίων για μερίδιο 49% στη γιγαντιαία κλίμακα σημασιολογίας δεδομένων AI για να εξασφαλίσει τον αγωγό δεδομένων της. Ωστόσο, η κίνηση γρήγορα ανακάμπτει.

Η μεγαλύτερη πελάτη της AI, η Google, ανακοίνωσε σχέδια για τη διάσπαση της συμφωνίας των 200 εκατομμυρίων δολαρίων για τους φόβους ότι η ουδετερότητα της κλιμάκωσης της ιδιοκτησίας της Meta. Ως <α href="https://vertexaisearch.cloud.google.com/grounding-api-redirect/auziyqfknpcfxdlm3qy7nrjx11a9xtto-94vgh 7Z6TJMRILSZGDNSSJO1OSKF1ZRQ9JWZDMW2VDHC5RZELRR6TI-3MCKLFQ8CCLWJD8VMT8__S5KVKKN3UWVY76MAUYJZB3GG9RE9TXY="Ο Kurt Wagner του Bloomberg συζήτησε τη συμφωνία , περιέγραψε μια”πραγματική παράνοια”στην εταιρεία, καλώντας την επένδυση”ένα κλασικό Mark Zuckerberg Move”για να βουτήξει βαθιά σε μια περιοχή όπου αισθάνεται ότι η επιχείρηση λείπει. Οι αντιπάλους Amazon και Microsoft για την ανάπτυξη του Llama σε ένα γήπεδο που ονομάστηκε”Κοινοπραξία λάμα”. Αυτός ο συνδυασμός εσωτερικής αναταραχής, τεράστιας οικονομικής πίεσης και αμφισβητήσιμων νομικών συντομεύσεων ζωγραφίζει μια εικόνα μιας εταιρείας που παίζει τη φήμη και το μέλλον της σε μια απελπισμένη προσφορά για να επιτύχει την υπεροχή του AI.

Categories: IT Info