AlphaEvolve AI de la Google DeepMind accelerează cercetarea matematică la o scară fără precedent, potrivit unui nouă lucrare publicată săptămâna aceasta de colaboratori, inclusiv renumitul matematician Terence Tao.
Cercetarea arată cum agentul AI a abordat 67 de probleme provocatoare, redescoperind soluții de top și găsind construcții noi pentru mai multe provocări de lungă durată.
Lucrarea demonstrează o nouă metodă puternică de colaborare om-AI în matematică pură. Folosește capacitatea inteligenței artificiale de a căuta spații vaste cu probleme pentru a genera perspective care completează intuiția umană, accelerând potențial calea către rezolvarea unor conjecturi renumite dificile.
Motor de descoperire operațională pentru matematică>
diferit de chatbot-urile de uz general care se luptă adesea cu rigoarea logică, AlphaEvolve utilizează un cadru evolutiv structurat.
Funcționează ca un „agent de codificare evoluționar generic”, utilizând modele mari de limbaj precum Gemini pentru a propune, testa și rafina iterativ soluții algoritmice. Această lucrare se bazează pe dezvăluirea inițială a instrumentului de către DeepMind în mai 2025.
Conform hartie de cercetare, „…AlphaEvolve este un instrument nou puternic pentru descoperirea matematică a problemelor complexe de căutare, capabile să exploreze spații complexe de căutare. scară.”
Într-o postare detaliată pe blog, Tao a explicat că metoda de bază a AI implică evoluția codului Python care caută o soluție, mai degrabă decât crearea directă a obiectului matematic.
Acest „mod de căutare” permite unui singur apel LLM lent să declanșeze un calcul masiv și ieftin, pe măsură ce euristica generată de căutare explorează milioane de posibilități de căutare proprii. Un „mod generalizator” contrastant solicită AI să găsească formule care funcționează pentru orice număr dat, urmărind o aplicabilitate mai largă.
Începerea pe noi linii de cercetare este remarcabil de eficientă în acest proces. Cercetătorii subliniază că pentru multe dintre problemele pe care le-au explorat, „… în medie, timpul obișnuit de pregătire pentru configurarea unei probleme folosind AlphaEvolve a durat doar câteva ore.”
O astfel de configurare rapidă permite matematicienilor să investigheze sistematic clase mari de probleme care altfel ar necesita o muncă de calcul extinsă, personalizată. Probleme
În timp ce sistemul a redescoperit cu succes soluții cunoscute pentru majoritatea celor 67 de probleme, cele mai semnificative contribuții ale sale au venit din găsirea unor abordări noi.
Cercetarea evidențiază o construcție nouă și promițătoare pentru seturile Nikodym, care a inspirat deja o lucrare viitoare a lui Tao. În plus, AlphaEvolve a descoperit noi construcții cu îmbunătățiri de ordin inferior pentru problema Kakeya cu câmp finit în dimensiunile 3, 4 și 5.
Dincolo de aceste zone extrem de abstracte, agentul și-a demonstrat și versatilitatea pe puzzle-uri geometrice mai tangibile. A redescoperit cu succes „Canapeaua Gerver” optimă pentru problema clasică a „canapelei în mișcare” și Romiks-blanks-Romiks”canapea” pentru varianta sa ambidextră.
Pentru o versiune 3D mai complexă a problemei, AlphaEvolve a produs o construcție nouă cu un volum riguros verificat de cel puțin 1,81, despre care cercetătorii cred că depășește candidații cunoscuți anterior.
Aceste succese prezintă un flux de lucru puternic care combină mai multe sisteme AI specializate. AlphaEvolve găsește mai întâi o construcție promițătoare, pe care un agent precum Deep Think, aceeași tehnologie din spatele câștigării medaliei de aur IMO de la DeepMind, o poate analiza apoi pentru a obține o dovadă a corectitudinii acesteia.
Această conductă poate culmina cu o verificare formală, cu un instrument precum AlphaProof care traduce dovada în limbaj natural într-un format de procesare automată, totuși, trebuie să fie nevoie de expertiză umană.
AI și validați-i rezultatele. Postarea pe blog a lui Tao subliniază că instrumentul nu este un matematician autonom și este predispus să găsească soluții inteligente. „… o cantitate netrivială de efort uman trebuie să fie implicată în proiectarea unui verificator care nu poate fi exploatat”, a scris el.
Un nou tip de verificare: AI ca partener de cercetare
În cele din urmă, cercetătorii poziționează AlphaEvolve nu ca un înlocuitor pentru matematicienii umani, ci ca un nou tip puternic de partener de cercetare. Capacitatea sa de a testa rapid ideile îl face un instrument ideal pentru explorarea inițială.
Așa cum notează Tao, „Îmi pot imagina că astfel de instrumente reprezintă o „verificare a logicii” utilă atunci când propun orice nouă presupunere.” Căutarea sistematică a contraexemplelor „evidente” ajută la validarea sau la îndoiala asupra ideilor noi înainte de a se investi un efort uman semnificativ.
Chiar și eșecurile sistemului oferă informații valoroase. Lucrarea notează că, în cele 67 de probleme, „…nu am infirmat nicio conjectură deschisă majoră. Desigur, o posibilă explicație evidentă pentru aceasta este că aceste conjecturi sunt de fapt adevărate.”
Această abordare riguroasă, bazată pe dovezi contrastează puternic cu ciclul de hype AI, exemplificat recent prin afirmația OpenAI de rezolvare a problemelor majore retractate de Erdő.
Acest pas greșit public a atras critici ascuțite din partea concurenților, CEO-ul Google DeepMind, Demis Hassabis, numind incidentul „peniant”.
Înconstruit în colaborare cu experți în domeniu, cadrul DeepMind pare conceput pentru a evita astfel de capcane. Lucrarea cu AlphaEvolve urmează o serie de descoperiri legitime în aplicarea AI la matematică, inclusiv sistemul AlphaGeometry2 care a depășit experții umani în problemele de geometrie olimpiadei.
Concentrându-se pe creșterea intuiției umane, mai degrabă decât pretinderea că rezolvă problemele în mod autonom, AlphaEvolve prezintă o cale mai sustenabilă și mai credibilă pentru descoperirea rolului AI în domeniul științific.>p