De AlphaEvolve AI van Google DeepMind versnelt wiskundig onderzoek op een ongekende schaal, volgens een nieuw artikel dat deze week is gepubliceerd door medewerkers, waaronder de beroemde wiskundige Terence Tao.
Het onderzoek laat zien hoe de AI-agent 67 uitdagende problemen aanpakte, topoplossingen herontdekte en nieuwe constructies vond voor verschillende al lang bestaande uitdagingen.
Het werk demonstreert een krachtige nieuwe methode voor samenwerking tussen mens en AI in de pure wiskunde. Het maakt gebruik van het vermogen van AI om grote probleemgebieden te doorzoeken om inzichten te genereren die de menselijke intuïtie aanvullen, waardoor mogelijk de weg wordt versneld naar het oplossen van beroemde moeilijke vermoedens.
Een evolutionaire motor voor wiskundige ontdekkingen
Anders werken dan chatbots voor algemene doeleinden die vaak worstelen met logische nauwkeurigheid, gebruikt AlphaEvolve een gestructureerd evolutionair raamwerk.
Het functioneert als een ‘generieke evolutionaire coderingsagent’, waarbij grote taalmodellen zoals Gemini worden gebruikt om algoritmische oplossingen voor te stellen, te testen en iteratief te verfijnen. Dit werk bouwt voort op de eerste onthulling door DeepMind van de tool in mei 2025.
Volgens het onderzoekspaper,”…AlphaEvolve is een krachtige nieuwe tool voor wiskundige ontdekkingen, die in staat is grote zoekruimten te verkennen om complexe optimalisatieproblemen op schaal op te lossen.”
In een gedetailleerde blogpost, Tao legde uit dat de kernmethode van de AI bestaat uit het ontwikkelen van Python-code die naar een oplossing zoekt, in plaats van het wiskundige object rechtstreeks te creëren.
Deze’zoekmodus’maakt het mogelijk dat een enkele, langzame LLM-aanroep een enorme, goedkope berekening activeert, terwijl de gegenereerde zoekheuristiek op zichzelf miljoenen mogelijkheden verkent. Een contrasterende “generalisatiemodus” geeft de AI de opdracht om formules te vinden die voor elk gegeven getal werken, met als doel een bredere toepasbaarheid.
Aan de slag gaan met nieuwe onderzoekslijnen is opmerkelijk efficiënt met dit proces. De onderzoekers benadrukken dat voor veel van de problemen die ze onderzochten, “…de gebruikelijke voorbereidingstijd voor het opzetten van een probleem met behulp van AlphaEvolve gemiddeld slechts een paar uur in beslag nam.”
Een dergelijke snelle installatie stelt wiskundigen in staat om systematisch grote klassen van problemen te onderzoeken die anders uitgebreid, op maat gemaakt computerwerk zouden vereisen.
Van het verplaatsen van banken tot Kakeya-sets: AI pakt open problemen aan
Terwijl het systeem succesvol is herontdekte bekende oplossingen voor de meeste van de 67 problemen, de belangrijkste bijdragen kwamen van het vinden van nieuwe benaderingen.
Het onderzoek benadrukt een nieuwe, veelbelovende constructie voor Nikodym-sets, die al een aanstaande paper van Tao heeft geïnspireerd. Daarnaast ontdekte AlphaEvolve nieuwe constructies met verbeteringen van lagere orde voor het Kakeya-probleem met het eindige veld in dimensies 3, 4 en 5.
Naast deze zeer abstracte gebieden demonstreerde de agent ook zijn veelzijdigheid op meer tastbare geometrische puzzels. Het heeft met succes de optimale’Gerver-bank’herontdekt voor het klassieke’bewegende bank’-probleem en de “Romik sofa” vanwege zijn tweehandige variant.
Voor een complexere 3D-versie van het probleem produceerde AlphaEvolve een nieuwe constructie met een rigoureus geverifieerd volume van minstens 1,81, waarvan de onderzoekers denken dat deze eerder bekende kandidaten overtreft.
Deze successen demonstreren een krachtige workflow die meerdere gespecialiseerde AI-systemen combineert. AlphaEvolve vindt eerst een veelbelovende constructie, die een agent als Deep Think, dezelfde technologie achter DeepMind’s IMO gouden medaillewinst, vervolgens kan analyseren om een bewijs van de juistheid ervan af te leiden.
Deze hele pijplijn kan uitmonden in formele verificatie, waarbij een tool als AlphaProof het natuurlijke taalbewijs vertaalt naar een machinaal controleerbaar formaat zoals Lean.
Het proces vereist echter aanzienlijke menselijke expertise om de AI te begeleiden en de resultaten ervan te valideren. Tao’s blogpost benadrukt dat de tool geen autonome wiskundige is en vatbaar is voor het vinden van slimme oplossingen. “…er moet een niet-triviale hoeveelheid menselijke inspanning worden gestoken in het ontwerpen van een niet-uitbuitbare verifier”, schreef hij.
Een nieuw soort Sanity Check: AI als onderzoekspartner
Uiteindelijk positioneren de onderzoekers AlphaEvolve niet als een vervanging voor menselijke wiskundigen, maar als een krachtig nieuw soort onderzoekspartner. Het vermogen om ideeën snel te testen maakt het een ideaal hulpmiddel voor een eerste verkenning.
Zoals Tao opmerkt:”Ik kan me voorstellen dat dergelijke hulpmiddelen een nuttige’sanity check’kunnen zijn bij het voorstellen van nieuwe vermoedens.”Het systematisch zoeken naar “voor de hand liggende” tegenvoorbeelden helpt nieuwe ideeën te valideren of in twijfel te trekken voordat er aanzienlijke menselijke inspanningen worden geïnvesteerd.
Zelfs de mislukkingen van het systeem leveren waardevolle informatie op. Het artikel merkt op dat we bij de 67 problemen”geen enkel belangrijk open vermoeden hebben weerlegd. Een voor de hand liggende mogelijke verklaring hiervoor is natuurlijk dat deze vermoedens in feite waar zijn.”
Deze rigoureuze, op bewijs gebaseerde aanpak staat in schril contrast met de AI-hypecyclus, onlangs geïllustreerd door OpenAI’s ingetrokken beweringen over het oplossen van grote Erdős-problemen.
Deze publieke misstap kreeg scherpe kritiek van concurrenten, met de CEO van Google DeepMind, de CEO. Demis Hassabis noemt het incident “beschamend.”
Het raamwerk van DeepMind, dat is gebaseerd op samenwerking met domeinexperts, lijkt ontworpen om dergelijke valkuilen te vermijden. Het werk met AlphaEvolve volgt op een reeks legitieme doorbraken in de toepassing van AI in de wiskunde, waaronder het AlphaGeometry2-systeem dat beter presteerde dan menselijke experts op het gebied van de geometrieproblemen van de Olympiade.
Door zich te concentreren op het vergroten van de menselijke intuïtie in plaats van te beweren problemen autonoom op te lossen, brengt AlphaEvolve een duurzamer en geloofwaardiger pad in kaart voor de rol van AI bij wetenschappelijke ontdekkingen.