Η κατάθεση στο δικαστήριο αποκαλύπτει πώς ο Ζάκερμπεργκ ενέκρινε τη χρήση πειρατικού περιεχομένου για εκπαίδευση τεχνητής νοημοσύνης των μοντέλων LLama

Η Meta Platforms βρίσκεται υπό έντονο νομικό έλεγχο για την εικαζόμενη χρήση πειρατικού υλικού στην εκπαίδευση των μοντέλων της Llama AI. Η εταιρεία, με επικεφαλής τον διευθύνοντα σύμβουλο Mark Zuckerberg, κατηγορείται ότι χρησιμοποιεί μη εξουσιοδοτημένα σύνολα δεδομένων από το LibGen, μια γνωστή πηγή πειρατικών βιβλίων και ακαδημαϊκά άρθρα.

Έγγραφα που κατατέθηκαν πρόσφατα για αγωγή που κατατέθηκε στο Περιφερειακό Δικαστήριο των ΗΠΑ για τη Βόρεια Περιφέρεια της Καλιφόρνια (έγγραφο 1, έγγραφο 2) ισχυρίζονται ότι ο Ζούκερμπεργκ ενέκρινε απευθείας τα δεδομένα χρήση, παρά τις εσωτερικές προειδοποιήσεις σχετικά με τη νομιμότητά του.

Εξέχοντες συγγραφείς, όπως η Sarah Silverman και η Sarah Silverman και Η Ta-Nehisi Coates, είναι μεταξύ των εναγόντων, υποστηρίζοντας ότι οι ενέργειες της Meta παραβιάζουν τη νομοθεσία περί πνευματικών δικαιωμάτων και τον Νόμο για τα δικαιώματα πνευματικής ιδιοκτησίας στην ψηφιακή εποχή (DMCA).

Επίσης, ισχυρίζονται παραβιάσεις του Ο νόμος της Καλιφόρνιας για την πρόσβαση και την απάτη σε δεδομένα υπολογιστών (CDAFA), υποδεικνύοντας δραστηριότητες torrenting και μεταδεδομένα που αφαιρούσαν την προέλευση των δεδομένων./p>

Τα Torrents είναι μια τεχνολογία κοινής χρήσης αρχείων peer-to-peer που επιτρέπει στους χρήστες να κάνουν λήψη αρχείων σε μικρότερα τμήματα από πολλές πηγές. Αν και είναι αποτελεσματικό για την κοινή χρήση μεγάλων συνόλων δεδομένων, χρησιμοποιείται συχνά για τη διανομή πειρατικού περιεχομένου, καθώς είναι αποκεντρωμένο και δύσκολο να παρακολουθηθεί.

Σχετικά: Η Meta παραδέχεται ότι πατά δεδομένα χρηστών του Facebook από την Αυστραλία για τεχνητή νοημοσύνη. Εκπαίδευση χωρίς συναίνεση

Έγκριση παρά τις εσωτερικές αντιρρήσεις

Εσωτερικά έγγραφα και καταθέσεις αποκαλύπτουν ένα προβληματικό πρότυπο λήψη αποφάσεων στο Meta. Οι μηχανικοί εξέφρασαν ανησυχίες σχετικά με τη χρήση του LibGen, με έναν να δηλώνει,”Το torrent από έναν εταιρικό φορητό υπολογιστή [που ανήκει στην Meta] δεν είναι σωστό.”

Αυτές οι αντιρρήσεις κλιμακώθηκαν στον Zuckerberg, ο οποίος τελικά ενέκρινε το σύνολο δεδομένων χρήση Ένα εσωτερικό σημείωμα επιβεβαίωσε, «Μετά την κλιμάκωση στο MZ [Mark Zuckerberg], η ομάδα AI της Meta εγκρίθηκε να χρησιμοποιήσει. LibGen.”

Αυτή η έγκριση έλαβε χώρα καθώς η Meta προσπάθησε να βελτιώσει τις δυνατότητες των μοντέλων της Llama, ένα κρίσιμο μέρος της στρατηγικής της να ανταγωνιστεί στον ταχέως αναπτυσσόμενο τομέα της τεχνητής νοημοσύνης. Το σύνολο δεδομένων LibGen φέρεται να χρησιμοποιήθηκε τόσο για εκπαίδευση όσο και για τελειοποίηση των μοντέλων, παρέχοντας τα δεδομένα μεγάλης κλίμακας που είναι απαραίτητα για την ανάπτυξη δυνατοτήτων επεξεργασίας γλώσσας.

Torrenting και αφαίρεση μεταδεδομένων

Η μήνυση κατηγορεί τη Meta ότι χρησιμοποίησε πρωτόκολλα torrenting για πρόσβαση και διανομή του δεδομένων LibGen. Το torrent περιλαμβάνει εγγενώς”σπορά”ή κοινή χρήση τμημάτων του περιεχομένου που έχει ληφθεί με άλλους χρήστες.

Σύμφωνα με μαρτυρία, οι μηχανικοί της Meta διαμόρφωσαν τις ρυθμίσεις torrenting για να ελαχιστοποιήσουν την ορατότητα. Όπως σημειώθηκε στην δικογραφία,”Ο Bashlykov διαμόρφωσε το [torrent ] ρυθμίσεις ώστε να μπορεί να προκύψει η μικρότερη ποσότητα σποράς”, μια προσπάθεια αποφυγής ανίχνευσης ενώ εξακολουθείτε να συμμετέχετε στην κοινή χρήση αρχείων δικτύου.

Εκτός από το torrent, η Meta φέρεται να απογύμνωσε το Πληροφορίες διαχείρισης πνευματικών δικαιωμάτων (CMI) από τα σύνολα δεδομένων εκπαίδευσης. Το CMI περιλαμβάνει μεταδεδομένα που επισυνάπτονται σε έργα που προστατεύονται από πνευματικά δικαιώματα που περιλαμβάνουν λεπτομέρειες όπως το όνομα του δημιουργού, την ημερομηνία δημοσίευσης και πληροφορίες αδειοδότησης. Η κατάργηση του CMI είναι παράνομη βάσει του DMCA, εάν διευκολύνει την παραβίαση πνευματικών δικαιωμάτων.

Οι ενάγοντες υποστηρίζουν ότι αυτή η κατάργηση ήταν μια σκόπιμη ενέργεια για να κρύψει την προέλευση του συνόλου δεδομένων και να εμποδίσει τα μοντέλα Llama να παράγουν αναγνωρίσιμο περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα.

Όπως αναφέρει η αγωγή,”Η Meta αφαίρεσε το CMI όχι μόνο για εκπαιδευτικούς σκοπούς, αλλά και για να κρύψει την παραβίαση πνευματικών δικαιωμάτων, επειδή η αφαίρεση του CMI των έργων που προστατεύονται από πνευματικά δικαιώματα εμποδίζει τη Llama να παράγει πληροφορίες πνευματικών δικαιωμάτων που ενδέχεται να προειδοποιήσουν τους χρήστες και το κοινό της Llama για παραβίαση του Meta.”

Ο Yann LeCun, ο επικεφαλής επιστήμονας AI της Meta, έδωσε πέρυσι μια υπόδειξη πώς σκέφτεται ο Μέτα για υλικό που προστατεύεται από πνευματικά δικαιώματα όταν πρότεινε στο X (πρώην Twitter) ότι οι συγγραφείς βιβλίων πρέπει να διαθέσουν ελεύθερα τα έργα τους.

Μόνο ένας μικρός αριθμός συγγραφέων βιβλίων κερδίζει σημαντικά χρήματα από τις πωλήσεις βιβλίων..
Αυτό φαίνεται να υποδηλώνει ότι τα περισσότερα βιβλία θα πρέπει να είναι ελεύθερα διαθέσιμα για λήψη.
Τα χαμένα έσοδα για τους συγγραφείς θα ήταν μικρά και τα οφέλη για την κοινωνία είναι μεγάλα https://t.co/4ObkW1tm85

— Yann LeCun (@ylecun) 1 Ιανουαρίου, 2024

Νομικές και ηθικές συνέπειες

Τα νομικά επιχειρήματα κατά της Meta περιλαμβάνουν αξιώσεις βάσει του DMCA για την κατάργηση CMI και CDAFA για πρόσβαση και χρήση πειρατικών δεδομένα χωρίς εξουσιοδότηση. Οι ενάγοντες ισχυρίζονται ότι το torrenting και η αφαίρεση μεταδεδομένων της Meta ήταν αναπόσπαστα στοιχεία για την απόκρυψη της χρήσης υλικού που προστατεύεται από πνευματικά δικαιώματα.

Ο δικαστής Vince Chhabria, που επιβλέπει την υπόθεση, επέκρινε τις προσπάθειες του Meta να διαγράψει σημαντικά τμήματα του φακέλου, σημειώνοντας, «Είναι σαφές ότι το αίτημα σφράγισης της Meta δεν έχει σχεδιαστεί για να προστατεύει από την αποκάλυψη ευαίσθητων επιχειρηματικών πληροφοριών… Μάλλον , έχει σχεδιαστεί για να αποφεύγει την αρνητική δημοσιότητα.”

Οι ισχυρισμοί εναντίον της Meta αποτελούν μέρος μιας ευρύτερης συζήτησης σχετικά με το πώς η τεχνητή νοημοσύνη Τα μοντέλα μεγάλων γλωσσών, όπως το Llama, βασίζονται συχνά σε τεράστια σύνολα δεδομένων που μπορεί να περιλαμβάνουν υλικό που προστατεύεται από πνευματικά δικαιώματα

Ενώ εταιρείες όπως η Meta υποστηρίζουν ότι αυτή η χρήση εμπίπτει στην ορθή χρήση. και υπογραμμίζει την ανάγκη για σαφέστερα νομικά πλαίσια για την ανάπτυξη της τεχνητής νοημοσύνης.

Ευρύτερη βιομηχανία. Πλαίσιο

Αυτή η υπόθεση δεν είναι ένα μεμονωμένο περιστατικό Η ταχεία ανάπτυξη της γενετικής τεχνητής νοημοσύνης οδήγησε σε πολλές αγωγές εναντίον μεγάλων εταιρειών τεχνολογίας, με τους δημιουργούς και τους κατόχους πνευματικών δικαιωμάτων να αμφισβητούν τη νομιμότητα και την ηθική της χρήσης των έργων τους. χωρίς συγκατάθεση.

Η περίπτωση του Meta αντανακλά μια ευρύτερη ένταση μεταξύ της τεχνολογικής καινοτομίας και των νόμων περί πνευματικής ιδιοκτησίας. Η μήνυση ρίχνει επίσης φως στις επιχειρησιακές αποφάσεις εντός της Meta, όπου η ώθηση για παραμονή ανταγωνιστική στην τεχνητή νοημοσύνη φαινομενικά υπερτερούσε των ηθικών και νομικών εκτιμήσεων.

Οι πρακτικές της Meta εγείρουν ερωτήματα σχετικά με το πώς οι εταιρείες εξισορροπούν την καινοτομία με τη συμμόρφωση και τη λογοδοσία. Η υπόθεση θα μπορούσε να αποτελέσει προηγούμενο για τον τρόπο με τον οποίο τα δικαστήρια χειρίζονται τη χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα στην εκπαίδευση τεχνητής νοημοσύνης, επηρεάζοντας ενδεχομένως τους κανονισμούς και τα πρότυπα του κλάδου.

Η κατάθεση στο δικαστήριο αποκαλύπτει πώς ο Ζάκερμπεργκ ενέκρινε τη χρήση πειρατικού περιεχομένου για εκπαίδευση τεχνητής νοημοσύνης των μοντέλων LLama

Published by All Things Windows on January 10, 2025

Έγκριση παρά τις εσωτερικές αντιρρήσεις

Torrenting και αφαίρεση μεταδεδομένων

Νομικές και ηθικές συνέπειες

Ευρύτερη βιομηχανία. Πλαίσιο

IT Info

Το OpenAI κόβει τους προγραμματιστές που κατασκεύασαν ένα ρομποτικό τυφέκιο φύλαξης με τροφοδοσία ChatGPT

IT Info

Το πλαίσιο rStar-Math της Microsoft επιτρέπει στα μικρά μοντέλα τεχνητής νοημοσύνης να ξεπερνούν τις επιδόσεις της σειράς o1 του OpenAI

IT Info

Automattic Scales Back Συνεισφορές WordPress Εν μέσω σύγκρουσης μηχανών WP

Η κατάθεση στο δικαστήριο αποκαλύπτει πώς ο Ζάκερμπεργκ ενέκρινε τη χρήση πειρατικού περιεχομένου για εκπαίδευση τεχνητής νοημοσύνης των μοντέλων LLama

Published by All Things Windows on January 10, 2025

Έγκριση παρά τις εσωτερικές αντιρρήσεις

Torrenting και αφαίρεση μεταδεδομένων

Νομικές και ηθικές συνέπειες

Ευρύτερη βιομηχανία. Πλαίσιο

Related Posts

IT Info

Το OpenAI κόβει τους προγραμματιστές που κατασκεύασαν ένα ρομποτικό τυφέκιο φύλαξης με τροφοδοσία ChatGPT

IT Info

Το πλαίσιο rStar-Math της Microsoft επιτρέπει στα μικρά μοντέλα τεχνητής νοημοσύνης να ξεπερνούν τις επιδόσεις της σειράς o1 του OpenAI

IT Info

Automattic Scales Back Συνεισφορές WordPress Εν μέσω σύγκρουσης μηχανών WP