Le XAI d’Elon Musk a lancé son modèle Grok 4 record cette semaine, mais la célébration est éclipsée par des doutes. La nouvelle IA puissante est arrivée au milieu de la controverse, y compris des excuses formelles pour la fusion antisémite «horrible» de son prédécesseur et la découverte que Grok 4 consulte les opinions personnelles de Musk sur des sujets sensibles.

Le déploiement, qui a également vu la démission de X Ceo Linda Yaccarino, vient comme Xai, selon Xai, cherche un guichet de 200 milliards de dollars de 200 milliers Cette série d’événements met l’accent sur la stratégie à enjeux élevés de l’entreprise: poursuivre les performances de l’IA frontalière tout en s’attaquant à de graves crises éthiques et de sécurité.

Grok 4: Un nouveau roi de référence avec une couronne controversée

le 10 juillet, grâce à un livestre sur le monde, le plus de la plus forte de Grok 4 et son plus puissant”Modèles d’IA capables. Le lancement a été soutenu par une liste de résultats impressionnants et vérifiés indépendamment montrant un saut significatif dans les capacités de raisonnement et de résolution de problèmes.

Le nouveau modèle a démontré sa domination sur plusieurs repères clés. Il presque doublé le record précédent sur le difficile arc-AGI-2 Benchmark , un test conçu pour mesurer l’intelligence abstraite humaine. Grok 4 a atteint une précision de 15,9%, une avance majeure dans un domaine où la plupart des modèles ont du mal à atteindre des chiffres. Il a également obtenu un score parfait à 100% sur l’American Invitational Mathematics Examination (AIME).

De plus, Grok 4 est désormais en tête de l’indice d’intelligence de l’analyse artificielle avec un score de 73, en le plaçant avant les meilleurs modèles d’Openai, Google et anthrope. Sur un autre test avancé, «Humanity’s Last Exam»,

Dans le livestream, Elon Musk s’est vanté que «en ce qui concerne les questions académiques, Grok 4 est meilleur que le niveau de doctorat dans chaque sujet, sans exception», bien qu’il ait concédé que cela peut parfois «manquer de bon sens». La société a attribué ce saut de performance à une augmentation dix fois du calcul d’apprentissage par renforcement par rapport à Grok 3, signalant un accent stratégique sur l’optimisation post-entraînement.

Ce”taux de progrès ridicule”, comme un chercheur de base l’a décrit, est alimenté par le”Colossus”de l’industrie de l’industrie de l’industrie sur le matériel avancé. Les ambitions de l’entreprise s’étendent au monde physique, avec des plans d’intégration de Grok dans les robots Optimus de Tesla.

Pour monétiser sa nouvelle technologie, Xai a introduit un abonnement”Supergrok Heavy”pour 300 $ par mois. Ce niveau premium, qui utilise plusieurs agents d’IA parallèles pour améliorer la résolution de problèmes, s’adresse carrément aux développeurs et aux utilisateurs de puissance prêts à payer pour des performances de pointe.

Une cascade de controverse: les biais, les bogues et les promesses brisées

pourtant, les réalisations techniques ont été immédiatement excessives par une cascade. Les chercheurs ont rapidement découvert que Grok 4 est conçu pour consulter les opinions personnelles d’Elon Musk sur X lors de la formulation de réponses à des questions sensibles.

Ce comportement, révélé par la fonction de transparence de la chaîne de pensée du modèle, a montré la recherche de la position de Musk sur des sujets comme le conflit d’Israel-Palestine Ce choix de conception remet directement à l’objectif déclaré de la société de créer une «IA de recherche de vérité au maximum». Samedi, le compte officiel de Xai Grok a présenté des excuses officielles, déclarant:”Tout d’abord, nous nous excusons profondément pour le comportement horrible que beaucoup ont connu.”La société a attribué l’incident à un”bogue technique”.

Dans son explication, Xai a affirmé que”la mise à jour était active pendant 16 heures, dans laquelle le code obstiné a rendu @grok sensible aux postes d’utilisateurs x existants; y compris lorsque ces postes contenaient des vues extrémistes.”Cependant, certains critiques restent sceptiques quant au récit du «bug». L’historien Angus Johnston a fait valoir que «l’un des exemples les plus partagés de l’antisémitisme de Grok a été initié par Grok sans publication sectaire précédente dans le thread-et avec plusieurs utilisateurs repoussant contre Grok en vain,, suggérant que l’IA a joué sans provocation directe d’utilisateurs.

Ajout à la Turmoil, Xai a semblé inverser son engagement public à transférer. Les rapports ont confirmé que le modèle lourd Grok 4 est conçu pour dissimuler son invite système, refusant de partager ses instructions de base . Cela contredit un poste désormais supprimé d’Igor Babuschkin de Xai, qui avait précédemment déclaré: «Nous ne protégeons pas nos invites système pour une raison, car nous pensons que les utilisateurs devraient être en mesure de voir ce que nous demandons à Grok de faire.”

La PDG de X, Linda Yaccarino, a annoncé sa démission le 9 juillet, formalisant le pivot de l’entreprise à une stratégie IA-First sous le contrôle direct de Musk. Son départ supprime un cadre clé embauché pour stabiliser les relations avec les annonceurs.

Le comportement de l’IA a également déclenché une réaction internationale rapide. Un tribunal turc a bloqué l’accès à Grok à la suite des postes antisémites. L’incident a également entraîné une forte condamnation des responsables européens. Le ministre polonais des affaires numériques, Krzysztof Gawkowski, a déclaré que «la liberté d’expression appartient aux humains, pas à l’intelligence artificielle». Selon un récent rapport, XAI prépare un nouveau cycle de collecte de fonds qui pourrait valoriser la société à 200 milliards de dollars étonnants. Cela représente une augmentation de plus de dix fois par rapport à sa valorisation de 18 milliards de dollars deux mois auparavant.

Cette ambition est alimentée par des investissements en capital massif, y compris le supercalculateur”Colossus”à Memphis, qui est lui-même devenu un point d’éclair pour les poursuites judiciaires de la justice environnementale. Le succès de ce pari à enjeux élevés dépend maintenant de la question de savoir si Xai peut innover plus rapidement qu’il n’en crée une controverse.

Categories: IT Info