Meta Platforms sta ritardando significativamente il suo modello di punta Llama 4 Behemoth AI. The company is pushing its debut from early summer to fall 2025 or later, The Wall Street Journal riportato . Questa battuta d’arresto deriva dalle lotte per migliorare le capacità del modello di grande lingua. Anche i timori interni che le sue prestazioni non soddisfano le dichiarazioni pubbliche contribuiscono, mettendo in dubbio la strategia di AI multimiliardaria di Meta. La notizia ha provocato un calo delle azioni di Meta fino al 3,2%.
Questo ritardo è fondamentale. Segnala il potenziale rallentamento nel progresso dell’intelligenza artificiale e solleva domande sulla direzione di Meta nonostante la vasta spesa. La società pianifica fino a $ 72 miliardi di spese in conto capitale quest’anno, in gran parte per l’IA. Secondo il Wall Street Journal, la frustrazione interna sta aumentando. Secondo quanto riferito, i dirigenti senior incolpano il team dei modelli Llama 4 per la mancanza di progressi su Behemoth.
Stanno anche contemplando”cambiamenti di gestione significativi”al gruppo di prodotti AI. Il CEO di Meta, Mark Zuckerberg, non ha fissato pubblicamente una sequenza temporale per Behemoth. Tuttavia, la società potrebbe ancora optare per una versione precedente e più limitata. Un portavoce di Meta ha rifiutato di commentare il Wall Street Journal sul ritardo.
ostacoli interni e aspettative mutevoli
Inizialmente, Behemoth è stato previsto per una versione di aprile. Ciò si sarebbe allineato con la prima conferenza per sviluppatori di intelligenza artificiale di Meta, prima che un obiettivo interno si spostasse a giugno. Ora, il suo futuro è meno chiaro. Le fonti del Wall Street Journal indicano che i meta ingegneri e i ricercatori sono preoccupati. Temono che la performance di Behemoth non sarebbe all’altezza delle premesse precedenti dell’azienda sulle sue capacità.
Questa preoccupazione è amplificata da questioni precedenti. Le informazioni Problemi precedentemente segnalati con i recenti modelli Llama. Meta ha anche riconosciuto l’invio di un modello di lama appositamente ottimizzato a una classifica ad aprile, non alla versione pubblicamente disponibile. Llama 4 è stato ricevere rapporti di qualità mista e risultati su parametri di riferimento competitivi che hanno messo dubbi . Ahmad al-Dahle di Meta ha attribuito la qualità variabile alla necessità di”stabilizzare le implementazioni”, come ha affermato su X.
Siamo lieti di iniziare a ottenere Llama 4 in tutte le tue mani. Stiamo già ascoltando molti ottimi risultati che le persone stanno ottenendo con questi modelli.
Detto questo, stiamo anche ascoltando alcuni rapporti di qualità mista attraverso diversi servizi. Da quando abbiamo lasciato cadere i modelli non appena erano…
-Ahmad al-Dahle (@ahmad_al_dahle) Il blog AI di Meta il 5 aprile ha messo in evidenza la prima promessa di Behemoth mentre era”ancora allenandosi”. La compagnia ha dichiarato il suo modello di insegnante, Llama 4 Behemoth,”Supera GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro su benchmark focalizzati sullo STEM come Math-500 e GPQA Diamond”. Il post ha anche menzionato l’intenzione di condividere più dettagli tecnici in seguito.
L’industria dell’intelligenza artificiale deve affrontare ritardi più ampi
La situazione di Meta con Behemoth non è unica. Riflette un modello più ampio di ritardi e ricalibrazioni nel settore dell’IA. L’anticipata GPT-5 di Openai, inizialmente prevista per la metà del 2024, ha affrontato battute d’arresto per lo sviluppo e apparentemente a una versione come GPT-4.5, con Openi che utilizzava il nome GPT-5 per un prossimo modello di pensiero. Il CEO di Openi Sam Altman ha successivamente chiarito a febbraio che un modello con importanti scoperte era ancora mesi di riposo. Allo stesso modo, il più grande modello di Opus Claude 3.5 di Antropico rimane inedito, anche se la società ha dichiarato in precedenza che stava”arrivando presto”.
Questi inciampi a livello di settore suggeriscono che i futuri progressi di intelligenza artificiale potrebbero arrivare a un ritmo più lento e costi più elevati di quanto inizialmente previsto. Ravid Shwartz-Ziv, un assistente professore presso il Center for Data Science della New York University, ha dichiarato al Wall Street Journal che ora”il progresso è piuttosto piccolo in tutti i laboratori, tutti i modelli”. Gene Munster di Deepwater Asset Management, commentando il ritardo di Behemoth a CNBC Television , lo ha caratterizzato per Meta come”è un occhio nero ma non cambia la loro opportunità.”
[contenuto incorporato]
elevate e alte domande
le immense risorse che meta sta riversando in AI, compresi i suoi ambiti per un non-scenario. Le pressioni finanziarie della razza AI sono state evidenziate da rapporti che indicavano che Meta aveva cercato finanziamenti esterni per lo sviluppo di Llama da concorrenti come Amazon e Microsoft, un pitch soprannominato come”Consorzio LAMA”.
Aggiunta alle complessità di sviluppo sono in corso domande legali ed etiche riguardanti i dati di formazione AI di Meta. Le cause attive, come una che coinvolge la comica Sarah Silverman, sostengono che la società ha formato i modelli di lama su enormi set di dati di libri piratati. I documenti del tribunale hanno persino citato un meta ingegnere senza nome che esprime il disagio, affermando:”Torrenting da un laptop aziendale [di proprietà] non si sente bene.”
Questi problemi, insieme alle strategie competitive di Meta come la sua mossa di Apple per bloccare le caratteristiche di Intelligenza Apple di Apple di Apple