Google DeepMinds AlphaEvolve AI akselererer matematisk forskning i en enestående skala, ifølge en ny artikkel publisert denne uken av samarbeidspartnere, inkludert den anerkjente matematikeren
Forskningen viser hvordan AI-agenten taklet 67 utfordrende problemer, gjenoppdaget toppløsninger og fant nye konstruksjoner for flere langvarige utfordringer.
Arbeidet demonstrerer en kraftig ny metode for menneske-AI-samarbeid i ren matematikk. Den bruker AIs evne til å søke i store problemområder for å generere innsikt som utfyller menneskelig intuisjon, noe som potensielt setter fart på veien til å løse kjente vanskelige formodninger.
An
AlphaEvolve fungerer annerledes enn chatboter med generelle formål som ofte sliter med logisk strenghet, og bruker et strukturert evolusjonært rammeverk.
Det fungerer som en”generisk evolusjonær kodingsagent”, som bruker store språkmodeller som Gemini for å foreslå, teste og iterativt forbedre algoritmer. Dette arbeidet bygger på DeepMinds første avsløring av verktøyet i mai 2025.
Ifølge forskningspapiret,”…AlphaEvolve er et kraftig nytt verktøy for matematiske løsninger for optimal søking for å løse komplekse problemstillinger for å løse store områder. skala.”
I et detaljert blogginnlegg forklarte Tao at AIs kjernemetode innebærer å utvikle Python-kode som søker etter en løsning, i stedet for å lage det matematiske objektet direkte.
Denne”søkemodusen”lar et enkelt, sakte LLM-kall utløse en massiv, billig beregning ettersom de genererte millioner søkeheuristiske muligheter utforsker sine egne muligheter. En kontrasterende «generaliseringsmodus» gir AI i oppgave å finne formler som fungerer for et gitt tall, med sikte på bredere anvendelighet.
Å komme i gang med nye undersøkelseslinjer er bemerkelsesverdig effektivt med denne prosessen. Forskerne fremhever at for mange av problemene de utforsket,”…i gjennomsnitt tok den vanlige forberedelsestiden for oppsett av et problem ved bruk av AlphaEvolve bare opptil noen få timer.”
Et slikt raskt oppsett lar matematikere systematisk undersøke store klasser av problemer som ellers ville kreve omfattende, skreddersydd beregningsarbeid.
From Mokeya Setles: Problemer
Selv om systemet vellykket gjenoppdaget kjente løsninger for de fleste av de 67 problemene, kom dets viktigste bidrag fra å finne nye tilnærminger.
Undersøkelsen fremhever en ny, lovende konstruksjon for Nikodym-sett, som allerede har inspirert en kommende artikkel fra Tao. I tillegg oppdaget AlphaEvolve nye konstruksjoner med forbedringer av lavere orden for det endelige feltet Kakeya-problemet i dimensjonene 3, 4 og 5.
Utover disse svært abstrakte områdene, demonstrerte agenten også sin allsidighet på mer håndgripelige geometriske gåter. Den gjenoppdaget den optimale”Gerver-sofaen”for klassisk”flyttesofa”-problemet og miks-sofax-sofaen for sin ambidekstrøse variant.
For en mer kompleks 3D-versjon av problemet, produserte AlphaEvolve en ny konstruksjon med et strengt verifisert volum på minst 1,81, som forskerne mener overgår tidligere kjente kandidater.
Disse suksessene viser frem en kraftig arbeidsflyt som kombinerer flere spesialiserte AI-systemer. AlphaEvolve finner først en lovende konstruksjon, som en agent som Deep Think, den samme teknologien bak DeepMinds IMO-gullmedaljevinner, deretter kan analysere for å utlede et bevis på dens korrekthet.
Hele denne pipelinen kan kulminere i formell verifisering, med et verktøy som AlphaProof som oversetter det naturlige språkbeviset til et maskinkontrollerbart format som Lean, men den betydelige ekspertise som Lean krever.
AI og validere utgangene. Taos blogginnlegg understreker at verktøyet ikke er en autonom matematiker og er tilbøyelig til å finne smarte løsninger.”…en ikke-triviell mengde menneskelig innsats må gå inn i utformingen av en ikke-utnyttbar verifikator,”skrev han.
En ny type fornuftssjekk: AI som forskningspartner
Til syvende og sist posisjonerer forskerne AlphaEvolve ikke som en erstatning for menneskelige matematikere, men som en kraftig ny type forskningspartner. Dens evne til raskt å teste ideer gjør den til et ideelt verktøy for innledende utforskning.
Som Tao bemerker,”Jeg kan tenke meg at slike verktøy er en nyttig”tilregnelighetssjekk”når jeg foreslår nye formodninger.”Systematisk søk etter «åpenbare» moteksempler bidrar til å validere eller så tvil om nye ideer før betydelig menneskelig innsats investeres.
Selv systemets feil gir verdifull informasjon. Avisen bemerker at på tvers av de 67 problemene,”… vi ikke motbeviste noen større åpen formodning. En åpenbar mulig forklaring på dette er selvfølgelig at disse formodningene faktisk er sanne.”
Denne strenge, evidensbaserte tilnærmingen står i skarp kontrast til AI-hype-syklusen, nylig eksemplifisert av OpenAIs tilbaketrukne store påstander om å løse offentlige feilsp; mottok skarp kritikk fra konkurrenter, og Google DeepMind-sjef Demis Hassabis kalte hendelsen «pinlig».
Grundet i samarbeid med domeneeksperter, ser DeepMinds rammeverk ut til å unngå slike fallgruver. Arbeidet med AlphaEvolve følger en rekke legitime gjennombrudd i bruken av AI i matematikk, inkludert AlphaGeometry2-systemet som overgikk menneskelige eksperter på Olympiads geometriproblemer.
Ved å fokusere på å forsterke menneskelig intuisjon i stedet for å hevde å løse problemer autonomt, kartlegger AlphaEvolve en mer bærekraftig og troverdig rolle for AI.