Die AlphaEvolve-KI von Google DeepMind beschleunigt die mathematische Forschung in einem beispiellosen Ausmaß, so ein neues Papier, das diese Woche von Mitarbeitern veröffentlicht wurde, darunter dem renommierten Mathematiker Terence Tao.
Die Forschung zeigt, wie der KI-Agent 67 herausfordernde Probleme bewältigte, Top-Lösungen wiederentdeckte und neuartige Konstruktionen für mehrere seit langem bestehende Herausforderungen fand.
Die Arbeit demonstriert eine leistungsstarke neue Methode für die Zusammenarbeit zwischen Mensch und KI in der reinen Mathematik. Es nutzt die Fähigkeit der KI, große Problemräume zu durchsuchen, um Erkenntnisse zu generieren, die die menschliche Intuition ergänzen und möglicherweise den Weg zur Lösung bekanntermaßen schwieriger Vermutungen beschleunigen.
Eine evolutionäre Engine für mathematische Entdeckungen
Funktioniert anders als für allgemeine Zwecke Da es sich um Chatbots handelt, die häufig mit logischer Genauigkeit zu kämpfen haben, verwendet AlphaEvolve ein strukturiertes evolutionäres Framework.
Es fungiert als „generischer evolutionärer Codierungsagent“ und nutzt große Sprachmodelle wie Gemini, um algorithmische Lösungen vorzuschlagen, zu testen und iterativ zu verfeinern. Diese Arbeit baut auf der ersten Vorstellung des Tools durch DeepMind im Mai 2025 auf.
Laut dem Forschungsbericht ist „…AlphaEvolve ein leistungsstarkes neues Tool für mathematische Entdeckungen, das in der Lage ist, riesige Suchräume zu erkunden, um komplexe Optimierungsprobleme in großem Maßstab zu lösen.“
Im Detail In einem Blogbeitrag erklärte Tao, dass die Kernmethode der KI darin besteht, Python-Code zu entwickeln, der nach einer Lösung sucht, anstatt das mathematische Objekt direkt zu erstellen.
Dieser „Suchmodus“ ermöglicht es einem einzelnen, langsamen LLM-Aufruf, eine umfangreiche, kostengünstige Berechnung auszulösen, während die generierte Suchheuristik selbst Millionen von Möglichkeiten untersucht. Ein kontrastierender „Generalisierungsmodus“ beauftragt die KI damit, Formeln zu finden, die für jede gegebene Zahl funktionieren, und zielt auf eine breitere Anwendbarkeit ab.
Der Einstieg in neue Forschungsrichtungen ist mit diesem Prozess bemerkenswert effizient. Die Forscher betonen, dass für viele der von ihnen untersuchten Probleme „… die übliche Vorbereitungszeit für die Erstellung eines Problems mit AlphaEvolve im Durchschnitt nur ein paar Stunden dauerte.“
Ein solch schneller Aufbau ermöglicht es Mathematikern, systematisch große Klassen von Problemen zu untersuchen, die sonst umfangreiche, maßgeschneiderte Rechenarbeit erfordern würden.
Vom Umzugssofa bis zum Kakeya-Set: KI bewältigt offene Probleme
Während das System erfolgreich ist bekannte Lösungen für die meisten der 67 Probleme wiederentdeckte, seine bedeutendsten Beiträge kamen aus der Suche nach neuartigen Ansätzen.
Die Forschung beleuchtet eine neue, vielversprechende Konstruktion für Nikodym-Sets, die bereits eine bevorstehende Arbeit von Tao inspiriert hat. Darüber hinaus entdeckte AlphaEvolve neue Konstruktionen mit Verbesserungen niedrigerer Ordnung für das Kakeya-Problem mit endlichen Feldern in den Dimensionen 3, 4 und 5.
Über diese hochabstrakten Bereiche hinaus zeigte der Agent seine Vielseitigkeit auch bei greifbareren geometrischen Rätseln. Es wurde erfolgreich das optimale „Gerver-Sofa“ für das klassische Problem des „beweglichen Sofas” und das „Romik“ wiederentdeckt Sofa“ für seine beidhändige Variante.
Für eine komplexere 3D-Version des Problems hat AlphaEvolve eine neuartige Konstruktion mit einem streng verifizierten Volumen von mindestens 1,81 erstellt, die nach Ansicht der Forscher bisher bekannte Kandidaten übertrifft.
Diese Erfolge zeigen einen leistungsstarken Workflow, der mehrere spezialisierte KI-Systeme kombiniert. AlphaEvolve findet zunächst eine vielversprechende Konstruktion, die ein Agent wie Deep Think, die gleiche Technologie, die hinter DeepMinds IMO-Goldmedaillengewinn steht, dann analysieren kann, um einen Beweis für deren Korrektheit abzuleiten.
Diese gesamte Pipeline kann in einer formalen Verifizierung gipfeln, wobei ein Tool wie AlphaProof den Beweis in natürlicher Sprache in ein maschinenprüfbares Format wie Lean übersetzt.
Der Prozess erfordert jedoch erhebliches menschliches Fachwissen, um die KI zu steuern und ihre Ergebnisse zu validieren. Taos Blogbeitrag betont, dass das Tool kein autonomer Mathematiker ist und dazu neigt, clevere Workarounds zu finden. „…in die Entwicklung eines nicht ausnutzbaren Verifikators muss eine nicht unerhebliche Menge menschlicher Anstrengung fließen“, schrieb er.
Eine neue Art von Sanity Check: KI als Forschungspartner
Letztendlich positionieren die Forscher AlphaEvolve nicht als Ersatz für menschliche Mathematiker, sondern als leistungsstarke neue Art von Forschungspartner. Seine Fähigkeit, Ideen schnell zu testen, macht es zu einem idealen Werkzeug für die erste Erkundung.
Tao bemerkt: „Ich kann mir vorstellen, dass solche Werkzeuge eine nützliche „Gesundheitsprüfung“ sind, wenn man neue Vermutungen vorschlägt.“ Die systematische Suche nach „offensichtlichen“ Gegenbeispielen trägt dazu bei, neue Ideen zu validieren oder in Zweifel zu ziehen, bevor erhebliche menschliche Anstrengungen unternommen werden.
Selbst Systemausfälle liefern wertvolle Informationen. In dem Papier heißt es, dass wir bei den 67 Problemen „keine größere offene Vermutung widerlegt haben. Eine offensichtliche mögliche Erklärung dafür ist natürlich, dass diese Vermutungen tatsächlich wahr sind.“
Dieser strenge, evidenzbasierte Ansatz steht in scharfem Kontrast zum KI-Hype-Zyklus, der kürzlich durch die zurückgezogenen Behauptungen von OpenAI, große Erdős-Probleme zu lösen, veranschaulicht wurde.
Dieser öffentliche Fehltritt löste scharfe Kritik von Konkurrenten aus, darunter Google Demis Hassabis, CEO von DeepMind, bezeichnete den Vorfall als „peinlich“.
Das DeepMind-Framework wurde in Zusammenarbeit mit Fachexperten entwickelt und scheint darauf ausgelegt zu sein, solche Fallstricke zu vermeiden. Die Arbeit mit AlphaEvolve folgt einer Reihe legitimer Durchbrüche bei der Anwendung von KI in der Mathematik, darunter das AlphaGeometry2-System, das menschliche Experten bei olympischen Geometrieproblemen übertraf.
Indem AlphaEvolve sich auf die Verbesserung der menschlichen Intuition konzentriert, anstatt zu behaupten, Probleme autonom zu lösen, zeichnet es einen nachhaltigeren und glaubwürdigeren Weg für die Rolle der KI in der wissenschaftlichen Entdeckung auf.