A IA AlphaEvolve do Google DeepMind está acelerando a pesquisa matemática em uma escala sem precedentes, de acordo com um novo artigo publicado esta semana por colaboradores, incluindo o renomado matemático Terence Tao.
A pesquisa mostra como o agente de IA abordou 67 problemas desafiadores, redescobrindo as principais soluções e encontrando novas construções para vários desafios de longa data.
O trabalho demonstra um novo método poderoso para a colaboração humano-IA em matemática pura. Ele usa a capacidade da IA de pesquisar vastos espaços de problemas para gerar insights que complementam a intuição humana, potencialmente acelerando o caminho para resolver conjecturas notoriamente difíceis.
Um mecanismo evolutivo para descoberta matemática
Operando de maneira diferente dos chatbots de uso geral que muitas vezes luta com o rigor lógico, o AlphaEvolve usa uma estrutura evolutiva estruturada.
Ele funciona como um “agente de codificação evolutivo genérico”, empregando grandes modelos de linguagem como o Gemini para propor, testar e refinar iterativamente soluções algorítmicas. Este trabalho se baseia no lançamento inicial da ferramenta pela DeepMind em maio de 2025.
De acordo com o artigo de pesquisa, “…AlphaEvolve é uma nova ferramenta poderosa para descoberta matemática, capaz de explorar vastos espaços de pesquisa para resolver problemas complexos de otimização em escala.”
Em um blog detalhado. post, Tao explicou que o método principal da IA envolve a evolução do código Python que busca uma solução, em vez de criar o objeto matemático diretamente.
Este “modo de pesquisa” permite que uma única e lenta chamada LLM acione uma computação massiva e barata à medida que a heurística de pesquisa gerada explora milhões de possibilidades por conta própria. Um “modo generalizador” contrastante incumbe a IA de encontrar fórmulas que funcionem para qualquer número, visando uma aplicabilidade mais ampla.
Iniciar novas linhas de investigação é extremamente eficiente neste processo. Os pesquisadores destacam que, para muitos dos problemas que exploraram,”…em média, o tempo normal de preparação para a configuração de um problema usando AlphaEvolve levou apenas algumas horas.”
Essa configuração rápida permite que os matemáticos investiguem sistematicamente grandes classes de problemas que, de outra forma, exigiriam um trabalho computacional extenso e personalizado.
De mover sofás a conjuntos Kakeya: a IA aborda problemas abertos
Enquanto o sistema funciona com sucesso redescobriu soluções conhecidas para a maioria dos 67 problemas, suas contribuições mais significativas vieram da descoberta de novas abordagens.
A pesquisa destaca uma construção nova e promissora para os conjuntos Nikodym, que já inspirou um próximo artigo de Tao. Além disso, AlphaEvolve descobriu novas construções com melhorias de ordem inferior para o problema de campo finito Kakeya nas dimensões 3, 4 e 5.
Além dessas áreas altamente abstratas, o agente também demonstrou sua versatilidade em quebra-cabeças geométricos mais tangíveis. Ele redescobriu com sucesso o “sofá Gerver” ideal para o problema clássico do “sofá em movimento” e o “Romik sofá” por sua variante ambidestra.
Para uma versão 3D mais complexa do problema, AlphaEvolve produziu uma nova construção com um volume rigorosamente verificado de pelo menos 1,81, que os pesquisadores acreditam superar os candidatos anteriormente conhecidos.
Esses sucessos mostram um fluxo de trabalho poderoso que combina vários sistemas especializados de IA. AlphaEvolve primeiro encontra uma construção promissora, que um agente como Deep Think, a mesma tecnologia por trás da medalha de ouro IMO da DeepMind, pode então analisar para obter uma prova de sua correção.
Todo esse pipeline pode culminar em verificação formal, com uma ferramenta como AlphaProof traduzindo a prova de linguagem natural em um formato verificável por máquina como Lean.
O processo, no entanto, requer experiência humana significativa para guiar a IA e validar seus resultados. A postagem no blog de Tao enfatiza que a ferramenta não é um matemático autônomo e é propensa a encontrar soluções alternativas inteligentes. “…é necessário um esforço humano nada trivial para projetar um verificador não explorável”, escreveu ele.
Um novo tipo de verificação de sanidade: a IA como parceira de pesquisa
Em última análise, os pesquisadores posicionam o AlphaEvolve não como um substituto para os matemáticos humanos, mas como um novo e poderoso tipo de parceiro de pesquisa. Sua capacidade de testar ideias rapidamente o torna uma ferramenta ideal para exploração inicial.
Como observa Tao, “posso imaginar que essas ferramentas sejam uma útil “verificação de sanidade” ao propor qualquer nova conjectura”. A busca sistemática por contra-exemplos “óbvios” ajuda a validar ou lançar dúvidas sobre novas ideias antes que um esforço humano significativo seja investido.
Mesmo as falhas do sistema fornecem informações valiosas. O artigo observa que, nos 67 problemas,”…não refutamos nenhuma conjectura aberta importante. É claro que uma possível explicação óbvia para isso é que essas conjecturas são de fato verdadeiras.”
Esta abordagem rigorosa e baseada em evidências contrasta fortemente com o ciclo de hype da IA, recentemente exemplificado pelas alegações retratadas da OpenAI de resolver os principais problemas de Erdős.
Esse erro público atraiu duras críticas dos concorrentes, com o CEO do Google DeepMind Demis Hassabis chamou o incidente de “embaraçoso”.
Baseada na colaboração com especialistas do domínio, a estrutura da DeepMind parece projetada para evitar tais armadilhas. O trabalho com AlphaEvolve segue uma série de avanços legítimos na aplicação de IA à matemática, incluindo o sistema AlphaGeometry2 que superou especialistas humanos em problemas de geometria olímpica.
Ao focar no aumento da intuição humana em vez de pretender resolver problemas de forma autônoma, AlphaEvolve traça um caminho mais sustentável e confiável para o papel da IA na descoberta científica.