Οι Meta Platforms καθυστερούν σημαντικά τη ναυαρχίδα Llama 4 Behemoth AI μοντέλο. Η εταιρεία πιέζει το ντεμπούτο της από τις αρχές του καλοκαιριού έως το φθινόπωρο 2025 ή αργότερα, το Wall Street Journal αναφέρθηκε . Αυτή η αποτυχία προέρχεται από τους αγώνες για τη βελτίωση των δυνατοτήτων του μοντέλου μεγάλης γλώσσας. Οι εσωτερικοί φόβοι ότι η απόδοσή του δεν θα ανταποκριθεί επίσης στις δημόσιες δηλώσεις, συμβάλλουν αμφιβολίες σχετικά με τη στρατηγική AI πολλών δισεκατομμυρίων δολαρίων της Meta. Οι ειδήσεις προκάλεσαν βουτιά στο απόθεμα της Meta μέχρι 3,2%.
Αυτή η καθυστέρηση είναι κρίσιμη. Σηματοδοτεί πιθανή επιβράδυνση στην πρόοδο του AI και εγείρει ερωτήματα σχετικά με την κατεύθυνση της Meta παρά τις τεράστιες δαπάνες. Η εταιρεία σχεδιάζει μέχρι 72 δισεκατομμύρια δολάρια σε κεφαλαιουχικές δαπάνες φέτος, κυρίως για την AI. Σύμφωνα με το περιοδικό Wall Street Journal, η εσωτερική απογοήτευση είναι η τοποθέτηση. Σύμφωνα με πληροφορίες, τα ανώτερα στελέχη κατηγορούν την ομάδα LLAMA 4 Models για την έλλειψη προόδου στο Behemoth. Ο Διευθύνων Σύμβουλος της Meta, Mark Zuckerberg, δεν έχει θέσει δημόσια ένα χρονοδιάγραμμα για τον Behemoth. Ωστόσο, η εταιρεία θα μπορούσε ακόμα να επιλέξει μια προηγούμενη, πιο περιορισμένη απελευθέρωση. Ένας εκπρόσωπος του Meta αρνήθηκε να σχολιάσει την Wall Street Journal για την καθυστέρηση. Αυτό θα είχε ευθυγραμμιστεί με το πρώτο συνέδριο προγραμματιστών της META, πριν μετατοπιστεί ο εσωτερικός στόχος στον Ιούνιο. Τώρα, το μέλλον του είναι λιγότερο σαφές. Οι πηγές της Wall Street Journal υποδεικνύουν τους μετα-μηχανικούς και τους ερευνητές. Φοβούνται ότι η απόδοση του Behemoth δεν θα ανταποκριθεί στις προηγούμενες αξιώσεις της εταιρείας σχετικά με τις δυνατότητές της.
Αυτή η ανησυχία ενισχύεται από προηγούμενα ζητήματα. Η Meta αναγνώρισε επίσης την υποβολή ενός ειδικά βελτιστοποιημένου μοντέλου LLAMA σε ένα leaderboard τον Απρίλιο, όχι τη διαθέσιμη στο κοινό έκδοση. Το Llama 4 ήταν Λήψη αναφορών μικτής ποιότητας και αποτελέσματα σε ανταγωνιστικά σημεία αναφοράς που αμφισβητούν αμφιβολίες . Ο Ahmad Al-Dahle της Meta αποδίδει μεταβλητή ποιότητα για να”σταθεροποιήσει τις υλοποιήσεις”, όπως δήλωσε στο x.
Ακούμε ήδη πολλά εξαιρετικά αποτελέσματα που παίρνουν οι άνθρωποι με αυτά τα μοντέλα.
Αυτό είπε, ακούμε επίσης κάποιες αναφορές μικτής ποιότητας σε διαφορετικές υπηρεσίες. Δεδομένου ότι ρίξαμε τα μοντέλα μόλις ήταν…
-Ahmad al-Dahle (@ahmad_al_dahle)
Η ανάπτυξη των Behemoth και άλλων μοντέλων LLAMA έχει επίσης δει σημαντικές αλλαγές στην ομάδα, με έντεκα από τους 14 αρχικούς ερευνητές χαρτιού LLAMA που είχαν αναχωρήσει από το Meta. Μια διαφορετική ομάδα χειρίζεται τώρα τις επόμενες εκδόσεις LLAMA.
Παρά τις τρέχουσες προκλήσεις, Το blog του Meta AI Στις 5 Απριλίου υπογράμμισε την πρώιμη υπόσχεση του Behemoth, ενώ ήταν”εξακολουθεί να εκπαιδεύει”. Η εταιρεία δήλωσε το μοντέλο καθηγητή της, LLAMA 4 Behemoth,”ξεπερνά το GPT-4.5, το Claude Sonnet 3.7 και το Gemini 2.0 Pro σε σημεία αναφοράς όπως το Math-500 και το GPQA Diamond”. Η θέση ανέφερε επίσης την πρόθεση να μοιραστούν περισσότερες τεχνικές λεπτομέρειες αργότερα. Αντικατοπτρίζει ένα ευρύτερο πρότυπο καθυστερήσεων και επαναβαθμονμάτων στον τομέα του ΑΙ. Το αναμενόμενο GPT-5 της OpenAI, που αναμένεται αρχικά γύρω στα μέσα του 2024, αντιμετώπισε αναπτυξιακές αποτυχίες και προφανώς σε απελευθέρωση ως GPT-4.5, με το OpenAI χρησιμοποιώντας το όνομα GPT-5 για ένα επερχόμενο μοντέλο σκέψης τώρα. Ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman, αργότερα διευκρίνισε τον Φεβρουάριο ότι ένα μοντέλο με σημαντικές ανακαλύψεις ήταν ακόμα μήνες μακριά. Ομοίως, το μεγαλύτερο μοντέλο CLAUDE 3,5 Opus της Anthropic παραμένει μη κυκλοφορούσε, αν και η εταιρεία δήλωσε νωρίτερα ότι”έρχεται σύντομα”. Ο Ravid Shwartz-Ziv, βοηθός καθηγητής στο Κέντρο Επιστήμης των Δεδομένων της Νέας Υόρκης, δήλωσε στο The Wall Street Journal ότι τώρα”η πρόοδος είναι αρκετά μικρή σε όλα τα εργαστήρια, όλα τα μοντέλα”. Gene Munster of Deepwater Asset Management, σχολιάζοντας την καθυστέρηση του μεγαθήρου στο CNBC Television , το χαρακτηρίζει για το meta ως”Είναι ένα μαύρο μάτι αλλά δεν αλλάζει την ευκαιρία τους.”Οι οικονομικές πιέσεις του αγώνα AI επισημάνθηκαν από αναφορές ότι η Meta είχε ζητήσει εξωτερική χρηματοδότηση για την ανάπτυξη του Llama από ανταγωνιστές όπως το Amazon και το Microsoft, ένα βήμα που ονομάζεται”Κοινοπραξία LLAMA”. Οι ενεργές αγωγές, όπως μία που εμπλέκονται στην κωμική Sarah Silverman, ισχυρίζονται ότι η εταιρεία εκπαιδεύει μοντέλα λάμα σε τεράστια σύνολα δεδομένων πειρατικών βιβλίων. Τα δικαστικά έγγραφα ανέφεραν ακόμη και έναν ανώνυμο μετα-μηχανικό που εκφράζει την ανησυχία του, δηλώνοντας ότι”το torrenting από ένα μετα-ιδιοκτησιακό φορητό υπολογιστή δεν αισθάνεται σωστό.