Il modello Alphageometry2 di Google DeepMind ha sovraperformato le medaglie d’oro umane in International Mathematical Olympiad (IMO) , Risoluzione dell’84% della geometria Problemi presentati negli ultimi 25 anni.

Alphageometry2 si basano sul suo predecessore alfageometria migliorando il suo linguaggio di rappresentazione. Google ha ampliato le sue capacità per gestire una gamma più ampia di problemi di geometria, compresi quelli che coinvolgono movimenti di oggetti e equazioni lineari relative ad angoli, rapporti e distanze.

Lo scorso luglio, il sistema già REACHED il livello della medaglia d’argento nella risoluzione dei problemi delle olimpiadi matematiche internazionali. immagine/gif; base64, r0lgodlhaqabaaaach5baekaaeaaaaaaaaaaaictaeaow==”>

Il nuovo successo posiziona il sistema di AI come una pietra miliare nel ragionamento computazionale, in mostra la capacità di DeepMind di spingere l’intelligenza artificiale in domini precedentemente dominata dall’experienza umana.

Il suo predecessore, l’alfageometria, ha ottenuto un tasso di successo di appena il 54%, segnando il nuovo sistema come un sostanziale salto in avanti.

Questa svolta si basa sull’eredità dei risultati di DeepMind, tra cui Alphafold 3 , che ha trasformato la previsione della struttura proteica e alphago , che ha dominato l’antico gioco di bordo di Go.

Entusiasta di condividere i dettagli di Alphageometry2 (AG2), parte del sistema che ha raggiunto lo standard di medicina d’argento all’IMO 2024 lo scorso luglio! Ag2 ora ha superato il medio medio di medalista oro nella risoluzione dei problemi di geometria delle Olimpiadi, raggiungendo un tasso di risoluzione dell’84% per tutti i problemi di geometria IMO… https://t. co/javtpndbmu pic.twitter.com/exhstdevtp

-thang luong (@lmthang) febbraio 7, 2025

L’applicazione dell’IA in matematica competitiva aggiunge a questo corpo in crescita di lavoro in crescita di lavoro in crescita di lavoro in crescita di lavoro in crescita di lavoro in crescita di lavoro in crescita , dimostrando l’adattabilità dei modelli di DeepMind nell’affrontare una vasta gamma di sfide.

Il sistema combina l’architettura della rete neurale con ragionamento simbolico, impiegando un approccio ibrido che gli consente di affrontare problemi che richiedono sia la creatività che la precisione logica.

Alphageometry2 non solo supera molti esperti umani, ma introduce anche tecniche che potrebbero influenzare una più ampia ricerca e applicazioni di intelligenza artificiale, compresi campi come l’ingegneria e la fisica.

Il suo successo è fondato su innovazioni come l’insieme di conoscenze condivise degli alberi di ricerca (SKEST) e dei motori simbolici ottimizzati, che consentono all’intelligenza artificiale di risolvere i problemi a velocità senza precedenti.

In AG1, utilizziamo una semplice ricerca del raggio per scoprire prove. In AG2, progettiamo un nuovo algoritmo di ricerca, chiamato Condividi Knowledge Ensemble degli alberi di ricerca (SKEST), per consentire a più ricerche di raggio di funzionare in parallelo e aiutarsi a vicenda. Questo è stato uno dei motivi per cui possiamo risolvere IMO… pic.twitter.com/Z1078G083W

-Thang Luong (@lmthang) 8 febbraio 2025

il design hybrid dietro Alphageometry2

al cuore di Alphageometry2 si trova la sua architettura ibrida, che combina una versione falnessa del modello di lingua gemina di DeepMind con un motore di ragionamento simbolico noto come DDAR (ragionamento aritmetico del database deduttivo).

Questa collaborazione consente all’intelligenza artificiale di interpretare e formalizzare problemi di geometria complessi, generare potenziali soluzioni e convalidare queste soluzioni attraverso rigorose prove logiche.

Secondo un recente pubblicato DeepMind Research Paper su Alphageometry2 ,”Questi miglioramenti culminano in un sostanziale miglioramento delle prestazioni delle prestazioni: Ag2 raggiunge un impressionante tasso di risoluzione dell’84% su tutti i problemi di geometria IMO 2000-2024, dimostrando un salto significativo in avanti nella capacità di AI di affrontare le attività di ragionamento matematico impegnativo.”

Il flusso di lavoro di Alphageometry2 è alimentato da SKEST, un algoritmo Ciò consente a più strategie di risoluzione dei problemi di lavorare in parallelo. , consentendo di esplorare simultaneamente più percorsi di ragionamento.

DeepMind ha anche implementato sostanziali aggiornamenti tecnici al motore di ragionamento simbolico del sistema. Predecessore, consentendo una risoluzione dei problemi più completa all’interno di budget computazionali limitati.

Queste ottimizzazioni ampliano la gamma di problemi che alfageometry2 può gestire, inclusi problemi di tipo locus complessi in cui gli oggetti si muovono pur mantenendo relazioni specifiche con altri elementi geometrici.

superando le prestazioni umane in Geometria

La performance di Alphageometry2 la colloca al di sopra della medaglia d’oro IMO media, che in genere risolve 40 problemi su 50 nel set di benchmark Imo-Ag-50.

Il sistema ha risolto 42 problemi, segnando un vantaggio leggero ma significativo rispetto agli esperti umani. Questo risultato è particolarmente sorprendente, data la difficoltà dei problemi IMO, che richiedono prove rigorose per le dichiarazioni sulle relazioni geometriche su un piano.

Uno degli aspetti più notevoli di Alphageometry2 è la sua capacità di risolvere i problemi di geometria avanzati, tali come quelli che coinvolgono loci. problemi locus-type richiedono la comprensione di come i punti o gli oggetti si muovono mentre preservano determinate condizioni, un compito che combina ragionamento astratto con il rigore matematico.

affrontando con successo queste sfide, Alphageometry2 ha ampliato la sua copertura problematica dal 66% all’88% dei problemi di geometria IMO.://winbuzzer.com/wp-content/upla La competizione dell’anno, che chiede di dimostrare la somma di ∠kil e ∠xpy equivale a 180 °. , creando molte coppie di triangoli simili come Abe ~ YBI e Ale ~ IPC doveva dimostrare la conclusione. Tieni molto prima che i computer ottengano marchi completi sull’IMO.”* ( natura ). Tali progressi suggeriscono che sistemi di intelligenza artificiale come Alphageometry2 non corrispondono solo alle prestazioni umane, ma potenzialmente ridefiniscono ciò che è raggiungibile nella risoluzione matematica dei problemi. è la sua dipendenza dai dati di formazione sintetica. DeepMind ha generato oltre 300 milioni di teoremi e prove sintetiche, coprendo una vasta gamma di complessità, per formare il modello linguistico basato su gemelli.

Questo approccio ha permesso all’IA di sviluppare una profonda comprensione dei principi geometrici e risolvere problemi che si estendono oltre i set di dati curati dall’uomo. Questi set di dati sintetici non solo migliorano le capacità di risoluzione dei problemi, ma dimostrano anche la scalabilità della ricerca AI di DeepMind. Il motore di ragionamento simbolico di Alphageometry2 di Alphageometry2, DDAR, svolge un ruolo chiave nel trasformare queste intuizioni teoriche in soluzioni pratiche. Verificando la coerenza logica dei suggerimenti del modello linguistico, DDAR garantisce che ogni fase del processo di risoluzione dei problemi aderisca a rigide regole matematiche.

Questa combinazione di adattabilità neurale e precisione logica distingue alfageometry2 oltre ai modelli di linguaggio di grandi dimensioni più tradizionali.

Nonostante le sue notevoli prestazioni, il sistema ha limiti. Lotta con problemi che coinvolgono disuguaglianze, equazioni non lineari e conteggi di punti variabili, aree che richiedono capacità di ragionamento ancora più avanzate. Secondo la ricerca di DeepMind,”Fino a migliorare la velocità del modello e le allucinazioni sono completamente risolte, strumenti come i motori simbolici rimarranno essenziali per le applicazioni matematiche”. >

Il successo di Alphageometry2 mostra il potenziale dei sistemi di intelligenza artificiale ibridi nella risoluzione di problemi altamente specializzati. Fisica, in cui modelli complessi si basano spesso su intricati calcoli geometrici.

combinando il ragionamento simbolico con le reti neurali, Alphageometry2 apre la strada ai sistemi di intelligenza artificiale in grado di affrontare le sfide che richiedono sia precisione che creatività.

DeepMind I più ampi progressi dell’IA forniscono un contesto prezioso per comprendere il significato di Alphageometry2. AlphaGo ha dimostrato il potenziale dell’intelligenza artificiale di padroneggiare il ragionamento strategico, mentre i modelli di grandi dimensioni come Gemini hanno introdotto modi innovativi per affrontare i problemi astratti.

prospettive e sfide future

Lo sviluppo di Alphageometry2 ha riacceso dibattiti all’interno della comunità di ricerca AI sul ruolo dei sistemi ibridi nella risoluzione di problemi complessi. Mentre i modelli di linguaggio di grandi dimensioni come i modelli GPT di Gemini o Openi eccellono nel generare testo simile all’uomo, spesso vacillano di fronte a compiti che richiedono ragionamento formale o coerenza logica.

Alphageometry2 colma questo divario integrando il ragionamento simbolico, offrendo un potenziale progetto per la prossima generazione di sistemi di intelligenza artificiale.

Tuttavia, rimangono le sfide. La dipendenza dai motori simbolici introduce le spese generali computazionali e l’incapacità del sistema di gestire determinati tipi di problemi evidenzia la necessità di un’ulteriore innovazione. Man mano che i ricercatori perfezionano il modello, l’integrazione di metodi di ragionamento avanzato e algoritmi più veloci saranno fondamentali per superare questi limiti.

Per i lettori interessati agli ultimi sviluppi dell’IA, gli sforzi in corso di DeepMind, tra cui il recente apertura di Alphafold 3, dimostra la dedizione dell’azienda all’espansione dei confini di ciò che l’IA può raggiungere.

Categories: IT Info