La gara per la supremazia dell’IA ha raggiunto una nuova vetta, poiché sia Google DeepMind che Openai ora affermano che i loro modelli possono conquistare le Olimpiadi matematiche internazionali (IMO), una delle sfide intellettuali più difficili dell’umanità.

Google ha annunciato lunedì che i suoi Gemini Deep pensano ai ha guadagnato una medicina dorata ufficialmente certificata alla 2025 competizione . La notizia è atterrata pochi giorni dopo che il rivale Openai ha rivelato che il suo modello ha raggiunto ufficiosamente lo stesso punteggio di alto livello.

Questo rilievo segnala un drammatico salto nel ragionamento dell’IA. It proves that general-purpose models can now solve complex mathematical problems at an elite human level, escalating the rivalry between the two AI leaders.

A Gold Medal Performance with a Competitive Twist

Il modello Gemini avanzato di Google DeepMind, migliorato con la tecnologia”Deep Think”, ha risolto perfettamente cinque dei sei problemi eccezionalmente difficili. Ha guadagnato 35 su 42 punti possibili, un punteggio ben all’interno di soglie di medici d’oro per la concorrenza di quest’anno. Il presidente dell’IMO Prof. Dr. Gregor Dolinar ha confermato il risultato, affermando:”Possiamo confermare che Google DeepMind ha raggiunto la pietra miliare tanto desiderata, guadagnando 35 su 42 punti possibili-un punteggio di medaglia d’oro. Le loro soluzioni erano sorprendenti per molti aspetti”. Tuttavia, la dichiarazione ufficiale dell’IMO ha chiarito solo valido le soluzioni, non il sistema di AI, non Risposta diretta ad OpenAI. Solo due giorni prima, Openai ha annunciato preventivamente il suo modello sperimentale aveva anche segnato 35 punti sugli stessi problemi, una mossa che ha attirato l’attenzione degli osservatori del settore.

dall’argento all’oro: un salto nel ragionamento AI

Questo risultato rappresenta un anticipo monumentale sulla performance di Google l’ultimo anno. Nel 2024, i suoi sistemi raggiunsero uno standard di medio d’argento ma richiede un intervento umano significativo e strumenti specializzati linguaggio naturale. Ha elaborato le descrizioni ufficiali dei problemi e ha generato direttamente prove matematiche rigorose, tutte entro il rigoroso limite di tempo di concorrenza di 4,5 ore.

Questo salto in avanti rimuove la necessità per gli esperti di tradurre problemi in linguaggi formali come Lean, un processo ingombrante che in precedenza limitava la velocità e l’autonomia del sistema. Mostra una forma più flessibile e potente di ragionamento dell’IA.

La razza per costruire una vera AI matematica

Entrambe le aziende stanno inquadrando i loro risultati come una vittoria per l’IA per uso generale. Il ricercatore di Openi Noam Brown ha sottolineato:”Questo non è un modello specifico per iMO. È un ragionamento LLM che incorpora nuove tecniche sperimentali per scopi generali”, un sentimento echeggiato dai suoi colleghi. Ciò suggerisce che i modelli sottostanti sono ampiamente capaci, non solo specialisti di matematica ristretti.

Il sistema di Google si basa sulla sua nuova architettura profonda. Questa modalità incorpora il pensiero parallelo, permettendo al modello di esplorare e combinare più potenziali percorsi di soluzione contemporaneamente, piuttosto che perseguire una singola catena di pensiero lineare.

Openi si muove di auto-segnalare i suoi risultati evidenzia l’intensa pressione per dimostrare la leadership, specialmente durante un periodo di sfide aziendali interne. Per Openai, raggiungendo quello che il CEO Sam Altman ha chiamato un”sogno”,”quando abbiamo iniziato Openai, questo era un sogno ma non uno che ci sembrava molto realistico”, funge da potente confutazione per le narrazioni di un’azienda che perde il suo vantaggio.

ciò che questo significhi per il futuro delle AI e della scienza

Attiene le capacità di fase di fase. Il ricercatore di Openai Alexander Wei ha osservato che il risultato rappresenta una”grande sfida di lunga data in AI”, aggiungendo”Sono entusiasta di condividere che il nostro ultimo ragionamento sperimentale di @openai LLM ha raggiunto una grande sfida di lunga data in AI: prestazioni a livello di medaglie d’oro, una concorso di matematica più prestigioso del mondo… DeepMind, ha espresso fiducia nei confronti dei prossimi passi, dicendo:”Siamo molto fiduciosi che possiamo portare [il modello] nelle mani dei nostri fidati tester molto presto, in particolare i matematici”. L’obiettivo è quello di mettere questi strumenti nelle mani dei matematici per aiutarli a risolvere problemi ancora più difficili.

Mentre l’attenzione immediata è sulla matematica, le implicazioni sono molto più ampie. Un’intelligenza artificiale che può ragionare con questo livello di creatività e rigore potrebbe accelerare le scoperte attraverso la scienza, l’ingegneria e la ricerca, avvicinandoci a un passo avanti verso l’obiettivo finale di AGI.

Categories: IT Info