La IA AlphaEvolve de Google DeepMind está acelerando la investigación matemática a una escala sin precedentes, según un nuevo artículo publicado esta semana por colaboradores, incluido el renombrado matemático Terence Tao.
La investigación muestra cómo el agente de IA abordó 67 problemas desafiantes, redescubriendo las mejores soluciones y encontrando construcciones novedosas para varios desafíos de larga data.
El trabajo demuestra un nuevo y poderoso método para la colaboración entre humanos e IA en matemáticas puras. Utiliza la capacidad de la IA para buscar vastos espacios de problemas para generar conocimientos que complementen la intuición humana, lo que potencialmente acelera el camino hacia la resolución de conjeturas famosamente difíciles.
Un motor evolutivo para el descubrimiento matemático
Operar de manera diferente a Como chatbots de propósito general que a menudo luchan con el rigor lógico, AlphaEvolve utiliza un marco evolutivo estructurado.
Funciona como un”agente de codificación evolutivo genérico”, que emplea grandes modelos de lenguaje como Gemini para proponer, probar y refinar de forma iterativa soluciones algorítmicas. Este trabajo se basa en la presentación inicial de la herramienta por parte de DeepMind en mayo de 2025.
Según el artículo de investigación, “…AlphaEvolve es una nueva y poderosa herramienta para el descubrimiento matemático, capaz de explorar vastos espacios de búsqueda para resolver problemas complejos de optimización a escala”.
En un blog detallado En esta publicación, Tao explicó que el método central de la IA implica la evolución de código Python que busca una solución, en lugar de crear el objeto matemático directamente.
Este”modo de búsqueda”permite que una única y lenta llamada de LLM desencadene un cálculo masivo y económico a medida que la heurística de búsqueda generada explora millones de posibilidades por sí sola. Un”modo generalizador”contrastante asigna a la IA la tarea de encontrar fórmulas que funcionen para cualquier número determinado, con el objetivo de lograr una aplicabilidad más amplia.
Comenzar en nuevas líneas de investigación es notablemente eficiente con este proceso. Los investigadores destacan que para muchos de los problemas que exploraron,”… en promedio, el tiempo de preparación habitual para la configuración de un problema usando AlphaEvolve tomó solo unas pocas horas”.
Esta configuración rápida permite a los matemáticos investigar sistemáticamente grandes clases de problemas que de otro modo requerirían un trabajo computacional extenso y personalizado.
De mover sofás a conjuntos Kakeya: la IA aborda problemas abiertos
Mientras el sistema tiene éxito redescubrió soluciones conocidas para la mayoría de los 67 problemas, sus contribuciones más significativas provinieron de la búsqueda de enfoques novedosos.
La investigación destaca una construcción nueva y prometedora para los conjuntos Nikodym, que ya ha inspirado un próximo artículo de Tao. Además, AlphaEvolve descubrió nuevas construcciones con mejoras de orden inferior para el problema de campo finito de Kakeya en las dimensiones 3, 4 y 5.
Más allá de estas áreas altamente abstractas, el agente también demostró su versatilidad en acertijos geométricos más tangibles. Redescubrió con éxito el “sofá Gerver”óptimo para el problema clásico del “sofá en movimiento” y el “Romik sofá” para su variante ambidiestra.
Para una versión 3D más compleja del problema, AlphaEvolve produjo una construcción novedosa con un volumen rigurosamente verificado de al menos 1,81, que los investigadores creen que supera a los candidatos previamente conocidos.
Estos éxitos muestran un poderoso flujo de trabajo que combina múltiples sistemas de IA especializados. AlphaEvolve primero encuentra una construcción prometedora, que un agente como Deep Think, la misma tecnología detrás de la medalla de oro de la OMI de DeepMind, puede luego analizar para obtener una prueba de su corrección.
Todo este proceso puede culminar en una verificación formal, con una herramienta como AlphaProof traduciendo la prueba en lenguaje natural a un formato verificable por máquina como Lean.
El proceso, sin embargo, requiere una importante experiencia humana para guiar la IA y validar sus resultados. La publicación del blog de Tao enfatiza que la herramienta no es un matemático autónomo y es propensa a encontrar soluciones inteligentes.”…se necesita una cantidad no trivial de esfuerzo humano para diseñar un verificador no explotable”, escribió.
Un nuevo tipo de control de cordura: la IA como socio de investigación
En última instancia, los investigadores posicionan a AlphaEvolve no como un reemplazo de los matemáticos humanos, sino como un nuevo y poderoso tipo de socio de investigación. Su capacidad para probar ideas rápidamente lo convierte en una herramienta ideal para la exploración inicial.
Como señala Tao,”Puedo imaginar que tales herramientas sean una”verificación de cordura”útil al proponer cualquier conjetura nueva”. La búsqueda sistemática de contraejemplos”obvios”ayuda a validar o poner en duda nuevas ideas antes de que se invierta un esfuerzo humano significativo.
Incluso las fallas del sistema brindan información valiosa. El documento señala que en los 67 problemas,”…no refutamos ninguna conjetura abierta importante. Por supuesto, una posible explicación obvia para esto es que estas conjeturas son de hecho ciertas”.
Este enfoque riguroso y basado en evidencia contrasta marcadamente con el ciclo exagerado de la IA, recientemente ejemplificado por las afirmaciones retractadas de OpenAI de resolver los principales problemas de Erdős.
Ese paso en falso público generó duras críticas de los competidores, incluido el CEO de Google DeepMind. Demis Hassabis calificó el incidente de”vergonzoso”.
Basado en la colaboración con expertos en el dominio, el marco de trabajo de DeepMind parece diseñado para evitar tales errores. El trabajo con AlphaEvolve sigue una serie de avances legítimos en la aplicación de la IA a las matemáticas, incluido el sistema AlphaGeometry2 que superó a los expertos humanos en los problemas de geometría de las Olimpíadas.
Al centrarse en aumentar la intuición humana en lugar de pretender resolver problemas de forma autónoma, AlphaEvolve traza un camino más sostenible y creíble para el papel de la IA en el descubrimiento científico.