Le XAI d’Elon Musk a intensifié la course aux armements de l’AI contre son rival Openai. Le 10 août, Xai a rendu son modèle Grok 4 gratuitement pour tous les utilisateurs à travers le monde pendant une durée limitée. Cette décision est un défi direct pour le modèle phare d’Openai, GPT-5, qui a lancé quelques jours plus tôt pour un début public rocheux.

Cette bataille à enjeux élevés pour les utilisateurs intervient alors que les deux entreprises sont confrontées à une vive critique. OpenAI aborde les rapports de bogues et d’erreurs dans GPT-5. Pendant ce temps, XAI fait face à des problèmes de sécurité continus, y compris son outil Grok Imagine créant un contenu DeepFake. Les lancements en duel mettent en évidence une tension de base de l’industrie.

Une histoire de deux lancements: Openai Stumbles, Xai Sunces

Openai dévoilé GPT-5 le 7 août, promettant un modèle plus intelligent, plus rapide et plus fiable. Le lancement a introduit une architecture unifiée conçue pour éliminer ce que le PDG Sam Altman avait précédemment appelé un «gâchis très déroutant». Il utilise un routeur en temps réel pour sélectionner automatiquement le meilleur modèle interne pour une tâche donnée.

pour la plupart des requêtes, il se relie sur un modèle de base efficace appelé `gpt-5-main`. Pour des problèmes plus complexes, il passe à un modèle de raisonnement plus profond, `gpt-5-thinking` {{u01}}. Pour la première fois, OpenAI a rendu ces capacités de haut niveau à la disposition des utilisateurs gratuits, un changement stratégique majeur visant à démocratiser l’accès à la pointe de l’IA.

La société a soutenu ses réclamations avec Résultats de benchmark impressionnant de sa carte système officielle . Le PDG Sam Altman a déclaré avec confiance: «C’est le meilleur modèle au monde en codage… le meilleur modèle au monde à l’écriture, le meilleur modèle au monde en soins de santé, et une longue liste de choses au-delà.»

Le lancement s’est cependant déroulé rapidement. Les utilisateurs sur les réseaux sociaux ont documenté une cascade de bugs bizarres et d’erreurs factuelles. Le modèle a produit des cartes avec des noms d’État fictifs comme «onegon» et «gelahbrin», a échoué à des problèmes mathématiques de base et a inventé les présidents américains de fiction, conduisant à un ridicule généralisé.

Le président William H. Brusen du grand état de Onegon https://t.co/cybzo7r03s pic.twitter.com/emfxnmnr2r

-eric vanderburg (@evandburg)

-eric vanderburg (@evandburg) href=”https://twitter.com/evanderburg/status/1953897138431443196?ref_src=twsrc%5etfw”Target=”_ Blank”> 8 août 2025

Un sondage informel a trouvé la plupart des utilisateurs qui rapportaient le modèle comme le modèle comme”MinkoTa>. La réception publique était extrêmement négative, un contraste frappant avec les allégations ambitieuses de la société. Sur le marché du marché de la prédiction, les chances d’Openai ayant le meilleur modèle d’ici la fin du mois sont passés de 75% à seulement 14% en une seule heure. Depuis lors, les chances ont révèlent légèrement à environ 22% au moment de la rédaction.

Le contrecoup était si grave qu’au 8 août, Altman a présenté des excuses publiques. Il a admis qu’un”Autoswitcher”défectueux entre les modes internes du modèle avait fait plus longtemps que”beaucoup plus stupide”que prévu. Dans un renversement significatif, OpenAI a promis de restaurer l’accès à son prédécesseur populaire, GPT-4O.

les mises à jour de déploiement de GPT-5:

* Nous allons doubler les limites de taux GPT-5 pour les utilisateurs de ChatGpt Plus alors que nous terminons le déploiement.

* Nous laisserons plus les utilisateurs choisir d’utiliser à utiliser 4o. Nous regarderons l’utilisation en pensant à la durée pour offrir des modèles hérités.

* GPT-5 semblera commencer plus intelligemment…

-Sam Altman (@Sama) 8 août 2025

Le déploiement erroné du GPT-5 a fourni des munitions aux critiques qui soutiennent que l’approche”de mise à l’échelle”de l’industrie frappe un mur. Le chercheur de l’IA, Gary Marcus, sceptique de longue date des méthodes actuelles, a déclaré:”Personne avec l’intégrité intellectuelle ne peut toujours croire que la mise à l’échelle pure nous amènera à AGI.”

Les erreurs n’étaient pas des problèmes mineurs mais des échecs fondamentaux. Pour un modèle sur lequel Openai travaillait depuis la fin de 2023, les erreurs étaient particulièrement embarrassantes. L’incident a forcé l’entreprise à une posture défensive, une position rare pour le leader de l’industrie.

Mon travail ici est vraiment terminé. Personne avec l’intégrité intellectuelle ne peut toujours croire que la mise à l’échelle pure nous amènera à AGI.

GPT-5 peut être une amélioration quantitative modérée (et elle peut être moins chère) mais elle échoue toujours de toutes les mêmes manières qualitatives que ses prédécesseurs, sur les échecs, sur…

-Gary Marcus (@GaryMarcus) août 8, 2025

Le 10 août, XAI a annoncé que Grok 4 était maintenant gratuit pour tous les utilisateurs du monde pour une durée limitée. Cette décision a été une réponse stratégique claire au trébuchement d’Openai, visant à capturer les utilisateurs désillusionnés avec une alternative puissante qui dispose également d’un système de routage automatique.

>

Grok 4 est désormais gratuit pour tous les utilisateurs du monde entier!

Utilisez simplement le mode Auto, et Grok va acheminer les requêtes complexes pour Grok 4. Préférez le contrôle? Choisissez”Expert”à tout moment pour toujours utiliser Grok 4.

Pour une durée limitée, nous déploions des limites d’utilisation généreuses afin que vous puissiez explorer Grok 4’s Full… pic.twitter.com/vw1pn3ivke href=”https://twitter.com/xai/status/1954573454214418820?ref_src=twsrc%5etfw”Target=”_ Blank”> 10 août, 2025

Grok’s Free-For-For-All GAMBIT MASKBO Problèmes

Alors que Xai a capitalisé sur le faux pas d’OpenAI, ses propres produits sont en proie à de graves problèmes éthiques et de sécurité. La version gratuite de Grok 4 coïncide avec la promotion de Grok Imagine, un outil de génération de vidéos qui a déjà été utilisé pour créer du contenu nocif.

quelques jours avant le lancement gratuit, les rapports ont révélé comment Grok Imagine Imagine est ce que l’on appelle le mode”épicé”de Taylor Swift. Le modèle a également été rapidement jailbreaké par des chercheurs en sécurité, et des projets internes comme «Skippy», qui ont utilisé des données faciales pour la formation, a déclenché des contrecoups sur les problèmes de confidentialité.

Une course aux armements définie par les défauts

la stratégie de Xai semble prioriser les performances de référence par rapport à l’utilité réelle. Malgré l’affirmation de Musk selon laquelle «En ce qui concerne les questions académiques, Grok 4 est meilleur que le niveau de doctorat dans chaque sujet, sans exception», les plates-formes de réfinitimes utilisateur racontent une histoire différente.

Yupp.ai Co-fondateur Jimmy Lin a trouvé que «Grok 4 est pire que les autres modèles de premier plan: Openai O3, Claude Opus 4, et le modèle 2.5 pro.”Overaged”aux tests ACE.

Cette concentration sur les mesures fait partie d’une «guerre de référence» plus large. Des documents divulgués ont révélé que XAI a embauché des entrepreneurs spécifiquement pour battre le claude d’Anthropic sur le codage des classements. Des critiques comme Sara Hooker, responsable de Cohere Labs, soutiennent que «lorsqu’un classement est important pour tout un écosystème, les incitations sont alignées pour qu’elle soit en jouant. La pression implacable pour innover et dominer est en train de pousser les modèles à la porte avant d’être vraiment prêts. Pour les utilisateurs, cela signifie naviguer dans un paysage d’outils puissants mais profondément imparfaits.

Categories: IT Info