Lo scorso fine settimana i ricercatori di OpenAI hanno scatenato una reazione negativa sui social media dopo aver celebrato prematuramente un’importante svolta matematica per GPT-5. In una serie di post su X, ora cancellati, diversi ricercatori affermavano che il modello avanzato aveva risolto i problemi di Erdős notoriamente difficili.

Tuttavia, il giro della vittoria è stato interrotto quando i matematici hanno corretto pubblicamente il record. Hanno chiarito che GPT-5 non aveva prodotto nuove soluzioni ma aveva invece trovato documenti accademici esistenti di cui i ricercatori non erano a conoscenza. L’imbarazzante inversione di tendenza ha suscitato aspre critiche da parte dei rivali del settore.

Il caso evidenzia l’enorme pressione all’interno del settore dell’intelligenza artificiale per mostrare progressi rivoluzionari. Serve anche come potente avvertimento sull’hype incontrollato in un campo in cui sono in gioco miliardi di dollari.

Falsi progressi incontrano una rapida correzione

L’eccitazione è iniziata il 18 ottobre quando il vicepresidente di OpenAI Kevin Weil e altri hanno pubblicato su X che GPT-5 aveva risolto 10 problemi”precedentemente irrisolti”posti dal famoso matematico Paul Erdős.

Ciò avrebbe segnato un passo avanti enorme per le capacità di ragionamento dell’IA generativa.

Paul Erdős (1913–1996) è stato un matematico ungherese celebrato come una delle figure più prolifiche e influenti del XX secolo nel campo della matematica. Ha pubblicato oltre 1.500 articoli di ricerca in diversi campi come la teoria dei numeri, la combinatoria, la teoria dei grafi, la teoria della probabilità e la teoria degli insiemi, spesso in collaborazione con più di 500 coautori. 

Le affermazioni si sono svelate quasi immediatamente. Il matematico Thomas Bloom, che gestisce il sito web Erdos Problems, ha pubblicamente smentito l’annuncio, definendolo”un drammatico errore di interpretazione”. Ha spiegato che i problemi erano elencati come”aperti”sul suo sito solo perché personalmente non era a conoscenza delle soluzioni esistenti.

Bloom ha chiarito che il vero risultato di GPT-5 è stato l’esecuzione di una sofisticata ricerca bibliografica. Ha osservato:”GPT-5 ha trovato riferimenti che hanno risolto questi problemi di cui personalmente non ero a conoscenza”. Il modello aveva agito come un assistente di ricerca, non come un matematico rivoluzionario. Le affermazioni iniziali e sensazionali sono state rapidamente cancellate o modificate.

Ciao, in qualità di proprietario/manutentore di https://t.co/69gOJM7Ci7, questa è una drammatica travisamento. GPT-5 ha trovato riferimenti che hanno risolto questi problemi di cui personalmente non ero a conoscenza.

Lo stato”aperto”significa solo che personalmente non sono a conoscenza di un documento che risolva il problema.

— Thomas Bloom (@thomasfbloom) 17 ottobre 2025

I rivali si lanciano in un errore pubblico”imbarazzante”

Il passo falso pubblico ha fornito ampie munizioni ai concorrenti di OpenAI. I rapidi e pubblici rimproveri da parte dei rivali non sono sorprendenti in un panorama di intelligenza artificiale estremamente competitivo.

Google, Meta e OpenAI sono impegnati in una battaglia per talenti, clienti aziendali e percezione pubblica.

Il CEO di Google DeepMind, Demis Hassabis, ha offerto una valutazione schietta su X, affermando semplicemente:”questo è imbarazzante”.

questo è imbarazzante

— Demis Hassabis (@demishassabis) 18 ottobre 2025

La sua azienda aveva recentemente eguagliato OpenAI con un suo legittimo risultato in matematica.

Lo scienziato capo dell’intelligenza artificiale di Meta, Yann LeCun, è stato ancora più acuto nella sua critica. Ha suggerito che OpenAI fosse caduta vittima del suo stesso marketing, scherzando dicendo che la società era “Issata dai propri GPTards.” L’incidente alimenta la narrazione di un’organizzazione sotto pressione e incline alla disattenzione.

In risposta alla domanda reazione negativa, i ricercatori di OpenAI, incluso Sebastien Bubeck, hanno cancellato o ritirato i loro post celebrativi iniziali.

Ho cancellato il post, ovviamente non intendevo fuorviare nessuno, pensavo che la frase fosse chiara, mi dispiace. Sono state trovate solo soluzioni in letteratura e questo è tutto, e trovo che questo sia molto accelerato perché so quanto sia difficile effettuare ricerche in letteratura.

— Sebastien Bubeck (@SebastienBubeck) 18 ottobre 2025

Mentre Bubeck difendeva il modello dicendo:”So quanto sia difficile cercare il letteratura”, il danno era fatto. Il tono trionfante è stato sostituito da uno difensivo.

Hype vs. Realtà: il vero ruolo dell’intelligenza artificiale in matematica

Questo episodio è un esempio da manuale del ciclo di hype dell’IA, in cui la promessa della tecnologia può superare le sue attuali capacità.

Gli analisti avvertono da tempo che il campo dell’IA generativa è si avvicina al”fondo della disillusione”poiché le nobili promesse incontrano i limiti del mondo reale.

Questa pressione non avviene nel vuoto. Per mesi, OpenAI ha attraversato un periodo di turbolenze interne, che ha visto l’azienda lottare per mantenere la sua narrativa pubblica di leadership incrollabile. L’azienda deve proiettare un’immagine di incessante innovazione per mantenere la propria posizione.

Ironicamente, questo errore è in contrasto con il genuino e recente successo di OpenAI nel campo della matematica. A luglio, la società ha annunciato che un modello sperimentale aveva ottenuto una medaglia d’oro alle Olimpiadi internazionali della matematica, un’impresa che richiedeva dimostrazioni creative e rigorose.

Questo risultato ha dimostrato un vero salto nel ragionamento dell’intelligenza artificiale che rende il successivo errore non forzato sui problemi di Erdős ancora più sconcertante. Sembra che la pressione per annunciare il prossimo grande passo abbia portato al fallimento della verifica di base.

Nonostante l’imbarazzante esagerazione, l’evento ha evidenziato l’utilità pratica di GPT-5. Come ha osservato il famoso matematico Terence Tao, il potenziale più immediato dell’intelligenza artificiale non è risolvere i problemi aperti più difficili.

Crede invece che”l’intelligenza artificiale generativa potrebbe aiutare a”industrializzare”la matematica e accelerare i progressi nel campo.”Trovando in modo efficiente documenti oscuri, GPT-5 ha dimostrato perfettamente questo punto.

Vista su Mastodon

L’evento in definitiva funge da promemoria fondamentale per l’intero settore. Man mano che i modelli di intelligenza artificiale diventano più potenti, la necessità di una rigorosa convalida scientifica diventa più importante che mai. Nella corsa ad alto rischio verso l’AGI, conoscere i fatti è fondamentale tanto quanto costruire la tecnologia stessa.

Categories: IT Info