Egy új tanulmány szerint a héten közzétett új tanulmány szerint a Google DeepMind AlphaEvolve AI példátlan léptékben gyorsítja fel a matematikai kutatásokat, többek között a neves matematikus Terence Tao.

A kutatás azt mutatja be, hogy az AI-ügynök hogyan oldott meg 67 kihívást jelentő problémát, hogyan fedezte fel újra a legjobb megoldásokat, és talált újszerű konstrukciókat számos régóta fennálló kihívásra.

A munka egy erőteljes új módszert mutat be az ember és a mesterséges intelligencia együttműködésére a tiszta matematikában. A mesterséges intelligencia azon képességét használja fel, hogy hatalmas problématerületeken keressen, hogy olyan betekintést hozzon létre, amely kiegészíti az emberi intuíciót, felgyorsítva ezzel a híresen nehéz sejtések megoldását.

Előmotor:

A gyakran logikai szigorral küszködő általános célú chatbotoktól eltérően működő AlphaEvolve strukturált evolúciós keretrendszert használ.

„Általános evolúciós kódoló ágensként” működik, nagy nyelvi modelleket, például a Geminit alkalmazva algoritmikus megoldások javaslatára, tesztelésére és iteratív megoldására. Ez a munka a DeepMind által 2025 májusában bemutatott eszközre épül.

A kutatási cikk szerint „…Az AlphaEvolve egy hatékony új eszköz a matematikai űrkutatási problémák megoldásához, optimalizálható űrkutatásokhoz és megoldásokhoz. skálán.”

Egy részletes blogbejegyzésben Tao kifejtette, hogy az AI alapvető módszere a Python-kód fejlesztése, amely megoldást keres, nem pedig a matematikai objektum közvetlen létrehozása.

Ez a „keresési mód”lehetővé teszi, hogy egyetlen, lassú LLM-hívás hatalmas, olcsó számítást indítson el, miközben a generált keresési heurisztikus lehetőségek millióit tárja fel. A kontrasztos „általánosító mód” arra bíztatja az MI-t, hogy olyan képleteket találjon, amelyek bármely adott számra működnek, a szélesebb körű alkalmazhatóság érdekében.

Az új kutatási irányok megismerése rendkívül hatékony ezzel a folyamattal. A kutatók kiemelik, hogy sok általuk feltárt probléma esetében „…átlagosan a szokásos felkészülési idő az AlphaEvolve használatával egy probléma felállítására csak néhány órát vett igénybe.”

Az ilyen gyors beállítás lehetővé teszi a matematikusok számára, hogy szisztematikusan vizsgálják meg a problémák nagy csoportjait, amelyek egyébként kiterjedt, egyedi számítási munkát igényelnének. Problémák

Míg a rendszer a 67 probléma többségére sikeresen újra felfedezte az ismert megoldásokat, a legjelentősebb hozzájárulást az újszerű megközelítések megtalálása jelentette.

A kutatás rávilágít a Nikodym készletek új, ígéretes konstrukciójára, amely már Tao egy hamarosan megjelenő tanulmányát is inspirálta. Ezenkívül az AlphaEvolve új konstrukciókat fedezett fel a 3., 4. és 5. dimenzióban a véges mező Kakeya-problémájára.

Ezeken a rendkívül absztrakt területeken túl az ügynök sokoldalúságát kézzelfoghatóbb geometriai rejtvényeken is bemutatta. Sikeresen újra felfedezte az optimális „Gerver kanapét” a klasszikus „mozgó kanapé” problémára és a a kétkezes változata miatt.

A probléma összetettebb 3D-s változatához az AlphaEvolve egy új konstrukciót készített, amelynek szigorúan ellenőrzött térfogata legalább 1,81, ami a kutatók szerint felülmúlja a korábban ismert jelölteket.

Ezek a sikerek olyan hatékony munkafolyamatot mutatnak be, amely több speciális AI-rendszert is ötvöz. Az AlphaEvolve először talál egy ígéretes konstrukciót, amelyet egy olyan ügynök, mint a Deep Think, a DeepMind IMO-aranyérme mögött meghúzódó technológia, elemezni tud, hogy bizonyítékot nyerjen a helyességére.

Ez az egész csővezeték formális ellenőrzésbe torkollik, egy olyan eszközzel, mint az AlphaProof, amely a természetes nyelvi bizonyítást emberileg lefordítja egy gépileg ellenőrizhető formátumba.

irányítani az AI-t és érvényesíteni a kimeneteit. Tao blogbejegyzése hangsúlyozza, hogy az eszköz nem önálló matematikus, és hajlamos okos megoldásokat találni. „…nem triviális emberi erőfeszítést igényel egy nem kihasználható hitelesítő megtervezése” – írta.

A józanság ellenőrzésének új fajtája: a mesterséges intelligencia kutatási partnerként

Végső soron a kutatók az AlphaEvolve-ot nem az emberi matematikusok helyettesítőjeként, hanem új, erőteljes kutatási partnerként tekintik. Az ötletek gyors tesztelésére való képessége ideális eszközzé teszi a kezdeti feltáráshoz.

Ahogyan Tao megjegyzi: „El tudom képzelni, hogy az ilyen eszközök hasznos „józanság-ellenőrzést” jelentenek, amikor bármilyen új sejtést javasolunk.” A „nyilvánvaló” ellenpéldák szisztematikus keresése segít az új ötletek érvényesítésében vagy megkérdőjelezésében, mielőtt jelentős emberi erőfeszítést tennénk.

Még a rendszer hibái is értékes információkat szolgáltatnak. A lap megjegyzi, hogy a 67 probléma kapcsán „…nem cáfoltunk meg egyetlen komoly nyílt sejtést sem. Ennek természetesen az egyik nyilvánvaló lehetséges magyarázata az, hogy ezek a sejtések valójában igazak.”

Ez a szigorú, bizonyítékokon alapuló megközelítés éles ellentétben áll az AI hype-ciklusával, amelyet nemrégiben az OpenAI visszavont állításai mutattak be a nagy nyilvánosság problémáinak megoldására vonatkozóan. A versenytársak kritikája, a Google DeepMind vezérigazgatója, Demis Hassabis „kínosnak” nevezte az incidenst.

A tartományszakértőkkel együttműködve a DeepMind keretrendszere úgy tűnik, hogy elkerülje az ilyen buktatókat. Az AlphaEvolve-val végzett munka a mesterséges intelligencia matematikai alkalmazásában egy sor jogos áttörést követ, beleértve az AlphaGeometry2 rendszert, amely felülmúlta az emberi szakértőket az Olimpia geometriai problémáiban.

Azáltal, hogy az emberi intuíció bővítésére összpontosít, nem pedig azt állítja, hogy a problémákat önállóan megoldja, az AlphaEvolve felfedezi az AIp> fenntarthatóbb tudományos szerepét és hitelességét.