L’IA AlphaEvolve de Google DeepMind accélère la recherche mathématique à une échelle sans précédent, selon un nouvel article publié cette semaine par des collaborateurs, dont le célèbre mathématicien Terence. Tao.
La recherche montre comment l’agent d’IA a résolu 67 problèmes complexes, redécouvert les meilleures solutions et trouvé de nouvelles constructions pour plusieurs défis de longue date.
Les travaux démontrent une nouvelle méthode puissante pour la collaboration homme-IA en mathématiques pures. Il utilise la capacité de l’IA à rechercher de vastes espaces de problèmes pour générer des informations qui complètent l’intuition humaine, accélérant potentiellement la résolution de conjectures célèbres et difficiles.
Un moteur évolutif pour la découverte mathématique
Fonctionnant différemment d’un moteur à usage général Chatbots qui ont souvent des difficultés avec la rigueur logique, AlphaEvolve utilise un cadre évolutif structuré.
Il fonctionne comme un « agent de codage évolutif générique », employant de grands modèles de langage comme Gemini pour proposer, tester et affiner de manière itérative des solutions algorithmiques. Ce travail s’appuie sur le dévoilement initial de l’outil par DeepMind en mai 2025.
Selon le document de recherche, « …AlphaEvolve est un nouvel outil puissant de découverte mathématique, capable d’explorer de vastes espaces de recherche pour résoudre des problèmes d’optimisation complexes à grande échelle. »
Dans une description détaillée article de blog, Tao a expliqué que la méthode principale de l’IA implique l’évolution du code Python qui recherche une solution, plutôt que de créer l’objet mathématique directement.
Ce « mode de recherche » permet à un seul appel LLM lent de déclencher un calcul massif et bon marché alors que l’heuristique de recherche générée explore par elle-même des millions de possibilités. Un « mode généraliseur » contrasté charge l’IA de trouver des formules qui fonctionnent pour un nombre donné, dans le but d’une applicabilité plus large.
Se lancer dans de nouvelles pistes de recherche est remarquablement efficace avec ce processus. Les chercheurs soulignent que pour bon nombre des problèmes qu’ils ont explorés, « … en moyenne, le temps de préparation habituel pour la configuration d’un problème à l’aide d’AlphaEvolve n’a pris que quelques heures. »
Une configuration aussi rapide permet aux mathématiciens d’étudier systématiquement de grandes classes de problèmes qui autrement nécessiteraient un travail informatique approfondi et sur mesure.
Des canapés mobiles aux ensembles Kakeya : l’IA s’attaque aux problèmes ouverts
Alors que le système réussit Après avoir redécouvert des solutions connues pour la plupart des 67 problèmes, ses contributions les plus significatives sont venues de la découverte de nouvelles approches.
La recherche met en évidence une nouvelle construction prometteuse pour les ensembles Nikodym, qui a déjà inspiré un prochain article de Tao. De plus, AlphaEvolve a découvert de nouvelles constructions avec des améliorations d’ordre inférieur pour le problème Kakeya à champ fini en dimensions 3, 4 et 5.
Au-delà de ces domaines très abstraits, l’agent a également démontré sa polyvalence sur des énigmes géométriques plus tangibles. Il a redécouvert avec succès le « canapé Gerver » optimal pour le problème classique du « canapé mobile » et le « Canapé Romik » pour sa variante ambidextre.
Pour une version 3D plus complexe du problème, AlphaEvolve a produit une nouvelle construction avec un volume rigoureusement vérifié d’au moins 1,81, qui, selon les chercheurs, surpasse les candidats connus précédemment.
Ces succès mettent en valeur un flux de travail puissant qui combine plusieurs systèmes d’IA spécialisés. AlphaEvolve trouve d’abord une construction prometteuse, qu’un agent comme Deep Think, la même technologie derrière la médaille d’or de DeepMind à l’OMI, peut ensuite l’analyser pour en tirer une preuve de son exactitude.
L’ensemble de ce pipeline peut aboutir à une vérification formelle, avec un outil comme AlphaProof traduisant la preuve en langage naturel dans un format vérifiable par machine comme Lean.
Le processus nécessite cependant une expertise humaine importante pour guider l’IA et valider ses résultats. Le billet de blog de Tao souligne que l’outil n’est pas un mathématicien autonome et qu’il est enclin à trouver des solutions de contournement intelligentes.”… un effort humain non négligeable doit être consacré à la conception d’un vérificateur non exploitable”, a-t-il écrit.
Un nouveau type de contrôle de santé mentale : l’IA en tant que partenaire de recherche
En fin de compte, les chercheurs positionnent AlphaEvolve non pas comme un remplaçant pour les mathématiciens humains, mais comme un nouveau type puissant de partenaire de recherche. Sa capacité à tester rapidement des idées en fait un outil idéal pour l’exploration initiale.
Comme le note Tao :”Je peux imaginer que de tels outils constituent un”contrôle de bon sens”utile lorsque l’on propose une nouvelle conjecture.”La recherche systématique de contre-exemples « évidents » permet de valider ou de mettre en doute de nouvelles idées avant qu’un effort humain important ne soit investi.
Même les défaillances du système fournissent des informations précieuses. Le document note que sur les 67 problèmes,”…nous n’avons réfuté aucune conjecture ouverte majeure. Bien sûr, une explication possible évidente est que ces conjectures sont en fait vraies.”
Cette approche rigoureuse et fondée sur des preuves contraste fortement avec le cycle de battage médiatique de l’IA, récemment illustré par les affirmations rétractées d’OpenAI selon lesquelles il résoudrait les problèmes majeurs d’Erdős.
Ce faux pas public a suscité de vives critiques de la part des concurrents, notamment du PDG de Google DeepMind. Demis Hassabis a qualifié l’incident d'”embarrassant”.
Construit en collaboration avec des experts du domaine, le cadre de DeepMind semble conçu pour éviter de tels pièges. Le travail avec AlphaEvolve fait suite à une série d’avancées légitimes dans l’application de l’IA aux mathématiques, notamment le système AlphaGeometry2 qui a surpassé les experts humains sur les problèmes de géométrie des Olympiades.
En se concentrant sur l’augmentation de l’intuition humaine plutôt que de prétendre résoudre les problèmes de manière autonome, AlphaEvolve trace une voie plus durable et crédible pour le rôle de l’IA dans la découverte scientifique.