La victoire sans effort du champion des échecs du monde Magnus Carlsen sur Chatgpt le 10 juillet illustre clairement l’état paradoxal de l’industrie de l’IA. Alors que Carlsen a méthodiquement démantelé le chatbot populaire, les laboratoires AI sont enfermés dans une bataille féroce pour la suprématie, vantant les réalisations surhumaines.

À la mi-juillet, Google et OpenAI ont affirmé que leurs modèles avaient obtenu un exploit de raisonnement avancé. Pourtant, ces progrès sont ombragés par la controverse, car des modèles comme la critique de Xai Grok 4 sont confrontés à la surdimension pour les références, biaisées et peu sûres.

Ce contraste entre les triomphes spécialisés et les défauts du monde réel soulignent la course chaotique et élevée pour soutenir l’avenir de l’intelligence.

Le camarade d’un grand maître prépare le terrain

Le 10 juillet, le champion du monde des effections artificielles Magnus Carlsen a offert un rappel d’énorme écart entre l’expertise humaine et l’intelligence artificielle. Dans un article sur X, il a partagé des captures d’écran de sa victoire décisive contre Chatgpt, plaisantant simplement: «Je m’ennuie parfois en voyage. Le match a servi de démonstration publique puissante d’un esprit humain d’élite démantelant une IA à usage général.

Carlsen n’est pas n’importe quel grand maître; Il est largement considéré comme le meilleur joueur d’échecs de l’histoire. Le Norwegian a remporté le championnat du monde d’échecs à cinq reprises, plus récemment en 2021, et détient le le plus haut niveau de fide du monde à 2839 . Malgré sa domination, il n’a pas participé au championnat traditionnel depuis sa dernière victoire, citant un manque de motivation, ce qui souligne sa position unique dans le sport. Ce contexte le fait comme le référence humaine ultime dans les échecs, faisant sa victoire occasionnelle sur une IA principale particulièrement importante.

La victoire n’était pas seulement une victoire; Ce fut un démantèlement sans faille. Carlsen a vérifié l’IA en seulement 53 mouvements sans perdre une seule pièce. Selon les captures d’écran partagées, Chatgpt a perdu tous ses pions avant qu’il ne soit contraint de démissionner du match, présentant l’avantage stratégique méthodique et écrasant du Grand Master.

L’échange d’après-match s’est avéré encore plus révélateur que le match lui-même. Après que l’IA l’a complimenté, disant: «C’était méthodique, propre et net. Bien joué!», Carlsen a offert sa propre critique, notant que l’AI «a très bien joué dans l’ouverture» mais «n’a pas réussi à le suivre correctement», selon Time .

Je m’ennuie parfois en voyage pic.twitter.com/mmkeecg0xn

-Magnus Carlsen (@Magnuscarlush href=”https://twitter.com/magnuscarlsen/status/1943473946063474990?ref_src=twsrc%5etfw”Target=”_ Blank”> Juillet 11, 2025

Dans un moment de profond Irony, THISSEL Les performances de Carlsen et ont estimé sa force classique à environ 1800-2000 FIDE. Cette évaluation est follement hors de la marque, car la cote de FIDE réelle de Carlsen est de 2839, ce qui fait de lui le joueur le mieux noté incontestable au monde.

Cette erreur flagrante met en évidence une limitation critique des modèles de grande langue actuels. Bien que capable d’exécuter des tâches complexes et de générer du texte poli, l’IA a démontré une profonde incapacité à saisir le vrai contexte. Il n’a pas reconnu qu’il jouait contre le plus grand joueur de l’histoire moderne.

Le démontage occasionnel de Carlsen d’une IA populaire fournit une référence convaincante et réelle qui contraste avec les tests plus abstraits de l’industrie. Il ouvre la voie à l’escalade de la course aux armements AI et encadre la tension fondamentale de l’ère actuelle: ces systèmes peuvent-ils vraiment raisonner, ou sont-ils simplement avancés, mais cassants, des modèles de modèles?

La race pour l’or: une olympiade d’algorithmes

La race armement des armes a été dégagée dramatiquement dans le milieu de l’intermédiaire, de la race au monde de la race armoise de l’Eldated dans le milieu de la jonction, de la cris de la cris de la race à la fin du monde de la race armoise de l’Eldated dans le milieu de la jonction, de la cris de la rachat de l’AI de l’Elfor mathématiques. Dans une superbe vitrine consécutive de la puissance de raisonnement, Openai et Google Deepmind ont annoncé que leurs modèles avaient conquis l’Olympiade mathématique internationale (IMO).

Cette percée représente une avance monumentale. Les modèles ont fonctionné de bout en bout en langage naturel, de traitement des problèmes et de générer des preuves sans l’intervention humaine ou les langues formelles spécialisées requises dans les tentatives précédentes.

Openai a tiré le premier coup le 19 juillet, le chercheur Alexander Wei révélant un modèle expérimental avait obtenu un score de médaille d’or dans une annonce préventive.”Je suis ravi de partager que notre dernier @Openai Experimental Reasoning LLM a relevé un grand défi de longue date dans l’IA…”, a-t-il posté sur X, le tramant comme un jalon pour l’IA générale.

À peine deux jours plus tard, Google Deepmind a fait son propre annonce. Son AI Gemini, améliorée de la technologie «Think Think», a également obtenu une médaille d’or, un résultat officiellement certifié par les coordinateurs de l’OMI. Le président de l’OMI, le professeur Gregor Dolinar, a confirmé la réussite, déclarant:”Nous pouvons confirmer que Google Deepmind a atteint la phase très désirée… leurs solutions étaient étonnantes à bien des égards.”

Les chercheurs des deux camps ont souligné que ces outils de résolution de mathématiques n’étaient pas étroits. Sébastien Bubeck d’Openai s’est émerveillé qu’une «machine de prédiction de mots du prochain» pourrait produire des «preuves véritablement créatives». Cela suggère que la technologie sous-jacente devient de plus en plus flexible et puissante.

Lorsque les repères se cassent: le lancement troublé de Grok 4

Alors que Google et Openai ont célébré les prouesses mathématiques, le XAI d’Elon Musk a offert un récit édifiant sur les chouchis de chaste. La société a lancé son modèle Grok 4 le 10 juillet, avec des scores record sur les tests académiques.

Le triomphe a été de courte durée. L’analyse indépendante a rapidement suggéré que le modèle était «surdiqué»-réglé aux tests ACE au détriment de la convivialité du monde réel. La plate-forme de réflexion utilisateur Yupp.ai a initialement classé Grok 4 un sombre 66e. Son co-fondateur, Jimmy Lin, a déclaré sans que «Grok 4 soit pire que les autres modèles leader: Openai O3, Claude Opus 4 et Gemini 2.5 Pro. Grok 4 est encore moins aimé que Grok 3. Il a suivi des excuses officielles pour la fusion antisémite «horrible» de son prédécesseur, que la société a blâmé à un «bug technique».

Les chercheurs ont ensuite découvert que Grok 4 a été conçu pour consulter les opinions personnelles d’Elon Musk sur des sujets sensibles, contreditant directement son objectif d’être un «Ai à voir en passant par maximum». Pour aggraver les choses, les chercheurs en sécurité de NeuralTrust ont réussi à jailbroke le modèle dans les 48 heures.

Future à enjeux élevés: des querelles d’entreprise à la nouvelle génération de l’IA

Ce paysage complexe d’innovation et de défaillance est facé par des rivalités d’entreprise intenses et des mangues de manœuvre stratégiques. La concurrence féroce oblige les entreprises à équilibrer un développement rapide avec des problèmes de sécurité critiques.

anthropic, par exemple, a adopté une position publique plus prudente. Il a mis en œuvre des protocoles de sécurité ASL-3 stricts pour son puissant modèle Claude 4 après que les tests internes ont révélé des risques potentiels de biosécurité. Le scientifique en chef Jared Kaplan a reconnu le danger, déclarant: «Vous pourriez essayer de synthétiser quelque chose comme covide ou une version plus dangereuse de la grippe-et fondamentalement, notre modélisation suggère que cela pourrait être possible.”

En attendant, le partenariat crucial entre Microsoft et Openai reste chargé de tension. Les désaccords publics sur la stratégie commerciale et la définition même d’AGI ont testé l’alliance. Le PDG de Microsoft, Satya Nadella, a rejeté l’idée d’Openai déclarant unilatéralement AGI comme «Us autonomisation de l’automobile de l’AGI, c’est juste un piratage de référence absurde». Drame, leur collaboration technologique se poursuit. Microsoft prépare déjà un nouveau mode «intelligent» pour Copilot, spécialement conçu pour intégrer le prochain modèle GPT-5 d’OpenAI. Cette décision signale qui, pour l’instant, le besoin partagé d’innovation l’emporte sur la rivalité des entreprises.

Categories: IT Info