Jak wynika z nowego artykułu opublikowanego w tym tygodniu przez współpracowników, w tym znanego matematyka Terence’a, sztuczna inteligencja AlphaEvolve firmy Google DeepMind przyspiesza badania matematyczne na bezprecedensową skalę Tao.
Badanie pokazuje, jak agent sztucznej inteligencji poradził sobie z 67 trudnymi problemami, ponownie odkrywając najlepsze rozwiązania i znajdując nowatorskie konstrukcje dla kilku długotrwałych wyzwań.
Praca demonstruje nową, potężną metodę współpracy człowieka z sztuczną inteligencją w czystej matematyce. Wykorzystuje zdolność sztucznej inteligencji do przeszukiwania rozległych przestrzeni problemowych w celu generowania spostrzeżeń uzupełniających ludzką intuicję, potencjalnie przyspieszając drogę do rozwiązania słynnych trudnych przypuszczeń.
Ewolucyjny silnik odkryć matematycznych
Działając inaczej niż chatboty ogólnego przeznaczenia, które często zmagają się z rygorem logicznym, AlphaEvolve wykorzystuje ustrukturyzowane ramy ewolucyjne.
Funkcjonuje jako „ogólny agent kodowania ewolucyjnego”, wykorzystując duże modele językowe, takie jak Gemini, do proponowania, testowania i iteracyjnego udoskonalania rozwiązań algorytmicznych. Ta praca opiera się na pierwszym zaprezentowaniu narzędzia przez DeepMind w maju 2025 r.
Według dokumentu badawczego „…AlphaEvolve to nowe, potężne narzędzie do odkryć matematycznych, zdolne do eksploracji rozległych przestrzeni poszukiwań w celu rozwiązywania złożonych problemów optymalizacyjnych na dużą skalę.”
W szczegółowym blogu post Tao wyjaśnił, że podstawowa metoda sztucznej inteligencji polega na rozwijaniu kodu Pythona, który wyszukuje rozwiązanie, a nie bezpośrednio tworzy obiekt matematyczny.
Ten „tryb wyszukiwania” pozwala pojedynczemu, powolnemu wywołaniu LLM wywołać ogromne, tanie obliczenia, podczas gdy wygenerowana heurystyka wyszukiwania samodzielnie bada miliony możliwości. Kontrastowy „tryb generalizatora” polega na znajdowaniu przez sztuczną inteligencję formuł, które działają dla dowolnej liczby, co ma na celu szersze zastosowanie.
Rozpoczynanie nowych poszukiwań jest w tym procesie niezwykle skuteczne. Naukowcy podkreślają, że w przypadku wielu badanych przez nich problemów „…przeciętny czas przygotowania do rozwiązania problemu za pomocą AlphaEvolve trwał zaledwie kilka godzin.”
Tak szybka konfiguracja pozwala matematykom na systematyczne badanie dużych klas problemów, które w przeciwnym razie wymagałyby obszernej, dostosowanej do indywidualnych potrzeb pracy obliczeniowej.
Od ruchomych sof do zestawów Kakeya: sztuczna inteligencja rozwiązuje otwarte problemy
Chociaż system z powodzeniem odkrył na nowo znane rozwiązania większości z 67 problemów, jego najważniejszy wkład wniósł znalezienie nowatorskich podejść.
Badanie uwydatniło nową, obiecującą konstrukcję zbiorów Nikodyma, która stała się już inspiracją dla mającej się ukazać publikacji Tao. Ponadto w ramach projektu AlphaEvolve odkryto nowe konstrukcje z ulepszeniami niższego rzędu dla problemu Kakeya pola skończonego w wymiarach 3, 4 i 5.
Poza tymi wysoce abstrakcyjnymi obszarami agent wykazał także swoją wszechstronność w przypadku bardziej namacalnych łamigłówek geometrycznych. Udało mu się ponownie odkryć optymalną „sofę Gerver” dla klasycznego problemu z „ruchomą sofą” i „Sofa Romik” w jej oburęcznym wariancie.
W przypadku bardziej złożonej wersji 3D problemu firma AlphaEvolve stworzyła nowatorską konstrukcję o rygorystycznie zweryfikowanej objętości co najmniej 1,81, która według badaczy przewyższa wcześniej znane kandydatury.
Te sukcesy pokazują potężny przepływ pracy, który łączy wiele wyspecjalizowanych systemów sztucznej inteligencji. AlphaEvolve najpierw znajduje obiecującą konstrukcję, którą agent taki jak Deep Think – ta sama technologia, która przyczyniła się do zdobycia złotego medalu IMO przez DeepMind – może następnie przeanalizować w celu uzyskania dowodu jej poprawności.
Cały proces może zakończyć się formalną weryfikacją za pomocą narzędzia takiego jak AlphaProof, które przetłumaczy dowód z języka naturalnego na format sprawdzalny maszynowo, taki jak Lean.
Proces ten wymaga jednak znacznej wiedzy ludzkiej, aby kierować sztuczną inteligencją i weryfikować jej wyniki. W poście na blogu Tao podkreślono, że narzędzie to nie jest autonomicznym matematykiem i ma skłonność do znajdowania sprytnych obejść. „…Zaprojektowanie weryfikatora, którego nie można wykorzystać, wymaga nietrywialnego wysiłku ludzkiego” – napisał.
Nowy rodzaj kontroli zdrowego rozsądku: sztuczna inteligencja jako partner w badaniach
Ostatecznie badacze pozycjonują AlphaEvolve nie jako zamiennik ludzkich matematyków, ale jako potężnego nowego rodzaju partnera badawczego. Jego zdolność do szybkiego testowania pomysłów czyni go idealnym narzędziem do wstępnej eksploracji.
Jak zauważa Tao: „Wyobrażam sobie, że takie narzędzia mogą stanowić użyteczną „kontrolę zdrowego rozsądku” przy proponowaniu jakichkolwiek nowych przypuszczeń”. Systematyczne wyszukiwanie „oczywistych” kontrprzykładów pomaga zweryfikować nowe pomysły lub podać w wątpliwość nowe pomysły, zanim zainwestuje się znaczny wysiłek ludzki.
Nawet awarie systemu dostarczają cennych informacji. W artykule zauważono, że w przypadku 67 problemów „…nie obaliliśmy żadnego większego otwartego przypuszczenia. Oczywiście jednym oczywistym możliwym wyjaśnieniem jest to, że przypuszczenia te są w rzeczywistości prawdziwe”.
To rygorystyczne, oparte na dowodach podejście ostro kontrastuje z cyklem szumu wokół sztucznej inteligencji, którego niedawno przykładem są wycofane twierdzenia OpenAI o rozwiązaniu głównych problemów Erdő.
To publiczne błędne posunięcie spotkało się z ostrą krytyką ze strony konkurentów, w tym dyrektora generalnego Google DeepMind. Demis Hassabis nazywa ten incydent „żenującym”.
Framework DeepMind, oparty na współpracy z ekspertami dziedzinowymi, wydaje się zaprojektowany tak, aby unikać takich pułapek. Praca z AlphaEvolve jest następstwem szeregu uzasadnionych przełomów w zastosowaniu sztucznej inteligencji w matematyce, w tym systemu AlphaGeometry2, który przewyższył ludzkich ekspertów w problemach z geometrią olimpiadową.
Koncentrując się na wzmacnianiu ludzkiej intuicji, zamiast twierdzić, że rozwiązuje problemy samodzielnie, AlphaEvolve wytycza bardziej zrównoważoną i wiarygodną ścieżkę roli sztucznej inteligencji w odkryciach naukowych.