Forskare vid OpenAI väckte motreaktioner på sociala medier den gångna helgen efter att ha firat ett stort matematiskt genombrott för GPT-5 i förtid. I en serie av nu raderade inlägg på X hävdade flera forskare att den avancerade modellen hade löst kända svåra Erdős problem.

Men, segervarvet avbröts när matematiker offentligt korrigerade rekordet. De klargjorde att GPT-5 inte hade tagit fram nya lösningar utan istället hittat befintliga akademiska artiklar som forskarna inte kände till. Den pinsamma omsvängningen fick skarp kritik från branschrivaler.

Ärendet belyser det enorma trycket inom AI-sektorn att visa upp banbrytande framsteg. Den fungerar också som en stark varnande berättelse om okontrollerad hype på ett område där miljarder dollar står på spel.

Falskt genombrott möter en snabb korrigering

Spänningen började den 18 oktober när OpenAI VP Kevin Weil och andra skrev på X att GPT-5 hade löst 10″tidigare olösta”problem från den berömda matematikern Paul Erdős.

Detta skulle ha markerat ett generativt steg. förmågor.

Paul Erdős (1913–1996) var en ungersk matematiker hyllad som en av 1900-talets mest produktiva och inflytelserika gestalter inom matematik. Han publicerade över 1 500 forskningsartiklar inom olika områden som talteori, kombinatorik, grafteori, sannolikhetsteori och mängdteori, ofta i samarbete med mer än 500 medförfattare. 

Anspråken löstes nästan omedelbart. Matematikern Thomas Bloom, som driver webbplatsen Erdos Problems, motbevisade offentligt tillkännagivandet och kallade det”en dramatisk misstolkning.”Han förklarade att problemen endast listades som”öppna”på hans sida eftersom han personligen inte var medveten om befintliga lösningar.

Bloom klargjorde att GPT-5:s verkliga prestation var att utföra en sofistikerad litteratursökning. Han noterade,”GPT-5 hittade referenser, som löste dessa problem, som jag personligen inte var medveten om.”Modellen hade fungerat som en forskningsassistent, inte en banbrytande matematiker. De första, sensationella påståendena raderades eller ändrades snabbt.

Hej, som ägare/underhållare av https://t.co/69gOJM7Ci7 är detta en dramatisk felaktig framställning. GPT-5 hittade referenser, som löste dessa problem, som jag personligen inte var medveten om.

Statusen”öppen”betyder bara att jag personligen inte känner till ett papper som löser det.

— Thomas Bloom (@thomasfbloom) 17 oktober 2025

Rivaler kastar sig ut på”pinsamt”offentlig misstag

Det offentliga misstaget gav gott om ammunition för OpenAIs konkurrenter. De snabba och offentliga tillrättavisningarna från rivaler är inte förvånande i ett hårt konkurrensutsatt AI-landskap.

Google, Meta och OpenAI är låsta i en kamp om talang, företagskunder och allmänhetens uppfattning.

Google DeepMinds vd Demis Hassabis erbjöd en rak bedömning på X och sa helt enkelt,”det här är pinsamt.”

det här är pinsamt

— Demis Hassabis (@demishassabis) 18 oktober, 2025

Hans företag hade nyligen matchat OpenAI med en egen legitim matteprestation.

Metas chefsforskare för AI, Yann LeCun, var ännu mer påpekad i sin kritik. Han föreslog att OpenAI hade fallit offer för sin egen marknadsföring, och beklagade att företaget “hissades av sina egna GPTards.” Händelsen föder en berättelse om en organisation som var under press och utsatt för vårdslöshet.

till motreaktionen tog OpenAI-forskarna, inklusive Sebastien Bubeck, bort eller gick tillbaka sina första högtidliga inlägg.

Jag tog bort inlägget, jag menade uppenbarligen inte att vilseleda någon, jag tyckte att fraseringen var tydlig, förlåt för det. Det är bara lösningar i litteraturen som har hittats, och jag tycker att detta accelererar mycket eftersom jag vet hur svårt det är att söka i litteraturen.

— Sebastien Bubeck (@SebastienBubeck) 18 oktober 2025

Medan Bubeck försvarade modellen, vet jag hur svårt att söka efter modellen genom att säga litteratur,”var skadan skedd. Den triumferande tonen hade ersatts av en defensiv.

Hype vs. Reality: The True Role of AI in Mathematics

Det här avsnittet är ett läroboksexempel på AI-hypecykeln, där löftet om teknik kan överträffa dess nuvarande kapacitet.

A href=”https://www.gartner.com/en/articles/hype-cycle-for-artificial-intelligence-pc1?utm_source=google&utm_medium=cpc&utm_campaign=GTR_GB_2025_GTR_CPC_SEM1_AIBRANDCAMPAIGN&utm_adgroup=191755933 412&utm_term=hype%20cycles&ad=777701903463&matchtype=p&gad_source=1&gad_campaignid=23091176768&g clid=CjwKCAjwu9fHBhAWEiwAzGRC__ZmkN8CwcEy79HS9YRou8jA4LKpO-9EvNM1oNlS8Td6pNvOUeIsKhoCB5AQAvD_BwE” target=”_blank”>att närma sig ett”tråg av desillusion”eftersom höga löften möter verkliga begränsningar.

Det här trycket sker inte i ett vakuum. I månader har OpenAI navigerat i en period av intern turbulens, vilket har sett företaget kämpa för att behålla sin offentliga berättelse om orubbligt ledarskap. Företaget måste projicera en bild av obeveklig innovation för att behålla sin position.

Ironiskt nog kontrasteras denna blunder med OpenAI:s äkta, senaste framgång inom matematik. I juli tillkännagav företaget att en experimentell modell hade uppnått guldmedaljer vid den internationella matematiska olympiaden, en bedrift som kräver kreativa och rigorösa bevis.

Den prestationen visade ett verkligt språng i AI-resonemang som gör det efterföljande otvingade misstaget över Erdős-problemen ännu mer förbryllande. Det verkar som om trycket att tillkännage nästa stora sak ledde till ett misslyckande med grundläggande verifiering.

Trots den pinsamma överdriften framhävde händelsen GPT-5:s praktiska användbarhet. Som den berömda matematikern Terence Tao har noterat är den mest omedelbara potentialen för AI inte att lösa de svåraste öppna problemen.

Istället tror han att”generativ AI skulle kunna hjälpa till att’industrialisera’matematik och påskynda framsteg inom området.”Genom att effektivt hitta obskyra papper bevisade GPT-5 den punkten perfekt.

Visa på Mastodon

Händelsen fungerar i slutändan som en kritisk påminnelse för hela branschen. När AI-modeller blir kraftfullare blir behovet av rigorös vetenskaplig validering viktigare än någonsin. I kapplöpningen mot AGI är det lika viktigt att få rätt fakta som att bygga själva tekniken.

Categories: IT Info