Meta-Plattformen verzögert das Flaggschiff LLAMA 4-Behemoth-AI-Modell erheblich. Das Unternehmen treibt sein Debüt vom Frühsommer bis zum Herbst 2025 oder später vor, das Wall Street Journal gemeldet . Dieser Rückschlag beruht auf Kämpfen, um die Fähigkeiten des großsprachigen Modells zu verbessern. Interne Befürchtungen, dass seine Leistung nicht öffentliche Aussagen entspricht, tragen ebenfalls dazu bei, dass sie Zweifel an der Multi-Milliarden-Dollar-KI-Strategie von Meta belegen. Die Nachricht führte zu einem Einbruch der Aktien von Meta von bis zu 3,2%.
Diese Verzögerung ist kritisch. Es signalisiert die potenzielle Verlangsamung des KI-Fortschritts und wirft trotz großer Ausgaben Fragen nach Metas Richtung auf. Das Unternehmen plant in diesem Jahr bis zu 72 Milliarden US-Dollar an Investitionsausgaben, hauptsächlich für KI. Laut dem Wall Street Journal ist die interne Frustration zunehmend. Berichten zufolge die Schuld des Lama 4-Models-Teams für den Mangel an Fortschritten bei Behemoth verantwortlich. Mark Zuckerberg, CEO von Meta, hat keine Zeitleiste für Behemoth festgelegt. Das Unternehmen könnte sich jedoch noch für eine frühere, begrenzte Veröffentlichung entscheiden. Ein Meta-Sprecher lehnte es ab, sich zum Wall Street Journal über die Verzögerung zu äußern. Dies hätte sich auf die erste KI-Entwicklerkonferenz von Meta ausgerichtet, bevor sich ein internes Ziel auf Juni verlagerte. Jetzt ist seine Zukunft weniger klar. Die Quellen des Wall Street Journal geben an, dass Meta-Ingenieure und Forscher besorgt sind. Sie befürchten, dass die Leistung von Gigantoth nicht den früheren Behauptungen des Unternehmens über seine Fähigkeiten erfüllen würde. Die Informationen zuvor berichtete Probleme mit den letzten LLAMA-Modellen. Meta bestätigte außerdem, im April ein speziell optimiertes Lama-Modell an eine Rangliste zu senden, nicht die öffentlich verfügbare Version. Lama 4 war Erhalten Sie Berichte und Ergebnisse von gemischten Qualität und Ergebnisse zu Wettbewerbsbenchmarks, die Zweifel werfen . METAs Ahmad al-Dahle führte die variable Qualität auf”Stabilisierung von Implementierungen”zurück, wie er auf x. Wir hören bereits viele großartige Ergebnisse, die Menschen mit diesen Modellen erzielen.
, dass wir auch einige Berichte über gemischte Qualität in verschiedenen Diensten hören. Da wir die Modelle fallen gelassen haben, sobald sie…
-Ahmad al-Dahle (@AHMAD_AL_DAHLE)
Die Entwicklung von Behemoth und anderen Lama-Modellen hat auch bedeutende Teamveränderungen verzeichnet, wobei elf der 14 ursprünglichen Lama-Papierforscher Meta verlassen hatten. Ein anderes Team übernimmt jetzt nachfolgende Lama-Versionen.
trotz der aktuellen Herausforderungen, metas AI-Blog Am 5. April hob das frühe Versprechen von Gigantoth hervor, während es”noch Training”war. Das Unternehmen gab an, dass sein Lehrermodell, LLAMA 4 Gigantoth, „GPT-4,5, Claude Sonnet 3.7 und Gemini 2.0 Pro auf Stiel-Fokus-Benchmarks wie Math-500 und GPQA Diamond übertrifft. In dem Beitrag wurde auch die Absicht erwähnt, später weitere technische Details zu teilen. Es spiegelt ein breiteres Muster von Verzögerungen und Neukalibrierungen im KI-Sektor wider. OpenAIs erwartete GPT-5, ursprünglich um Mitte 2024 erwartet, wurden mit Rückschlägen der Entwicklung und anscheinend zu einer Veröffentlichung als GPT-4,5 ausgesetzt. Sam Altman, CEO von OpenAI, stellte später im Februar klar, dass ein Modell mit großen Durchbrüchen noch Monate frei lag. In ähnlicher Weise bleibt Anthropics größeres Claude 3.5-Opus-Modell unveröffentlicht, obwohl das Unternehmen zuvor festgestellt hat, dass es „bald“ kommt. Ravid Shwartz-Ziv, Assistenzprofessor am Center for Data Science der New York University, sagte gegenüber dem Wall Street Journal:”Der Fortschritt ist jetzt in allen Labors, allen Modellen, recht klein.”Gene Munster von Deepwater Asset Management und kommentiert die Verzögerung des Gigens zu CNBC-Fernseher , charakterisierte es für Meta als”Es ist ein blaues Auge, ändert jedoch keine Chance.”Der finanzielle Druck des KI-Rennens wurde durch Berichte hervorgehoben, in denen darauf hingewiesen wurde, dass Meta von Wettbewerbern wie Amazon und Microsoft eine externe Finanzierung für die Lama-Entwicklung gesucht hatte, eine Tonhöhe, die als”Lama-Konsortium”bezeichnet wird. Aktive Klagen wie eine, an der die Komiker Sarah Silverman beteiligt sind, behaupten, dass das Unternehmen Lama-Modelle auf massiven Datensätzen von Raubkopien ausgebildet habe. Gerichtsdokumente zitierten sogar einen unbenannten Meta-Ingenieur, der Unbehagen ausdrückte und erklärte: „Torrenting von einem [meta-Eigentum] Corporate-Laptop fühlt sich nicht richtig an.”