Loppet för AI Supremacy har nått en ny topp, eftersom både Google DeepMind och OpenAi nu hävdar att deras modeller kan erövra den internationella matematiska olympiaden (IMO), en av mänsklighetens tuffaste intellektuella utmaningar. href=”https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think officially-achieves-gold-medal-standard-at-t-the-the-international-mathematical-lympiad/”Target=”_ blank”> Earned en officiellt certifierat medal på 202555. Nyheterna landade bara några dagar efter att rival Openai avslöjade att sin egen modell inofficiellt hade uppnått samma toppnivå.

Detta genombrott signalerar ett dramatiskt språng i AI-resonemang. Det bevisar att modeller för allmänt syfte nu kan lösa komplexa matematiska problem på en elit mänsklig nivå och eskalera rivaliteten mellan de två AI-ledarna.

guldmedalj för årets tävling . IMO: s president Professor Dr. Gregor Dolinar bekräftade prestationen och konstaterade:”Vi kan bekräfta att Google DeepMind har nått den eftertraktade milstolpen och tjänat 35 av möjliga 42 poäng-en guldmedaljpoäng. Deras lösningar var häpnadsväckande i många avseenden.”Emellertid klargjorde IMO: s officiella uttalande det endast krävde betydande mänskliga interventioner och specialiserade verktyg . språk. Den behandlade de officiella problembeskrivningarna och genererade rigorösa matematiska bevis direkt, allt inom den strikta 4,5-timmars tävlingstidsgränsen.

Detta språng framåt tar bort behovet av experter att översätta problem till formella språk som Lean, en besvärlig process som tidigare begränsade systemets hastighet och autonomi. Den visar en mer flexibel och kraftfull form av AI-resonemang.

Loppet för att bygga en riktig AI-matematiker

Båda företagen inramar sina prestationer som en seger för allmänna AI. Openai-forskare Noam Brown betonade,”Detta är inte en IMO-specifik modell. Det är en resonemang LLM som innehåller nya experimentella allmänna tekniker”, ett känsla som ekade av sina kollegor. Detta antyder att de underliggande modellerna är i stort sett kapabla, inte bara smala matematikspecialister.

Googles system förlitar sig på sin nya Deep Think-arkitektur. Detta läge innehåller parallellt tänkande, vilket gör att modellen kan utforska och kombinera flera potentiella lösningsvägar på en gång, snarare än att sträva efter en enda, linjär tankekedja.

OpenAI: s steg för att självrapportera sina resultat belyser det intensiva trycket för att visa ledarskap, särskilt under en period med interna företagsutmaningar. För OpenAI, att uppnå vad VD Sam Altman kallade en”dröm”,”När vi först började OpenAI var detta en dröm men inte en som kändes väldigt realistisk för oss”, fungerar som ett kraftfullt motbevis för berättelser om ett företag som förlorar sin kant.

vad detta betyder för framtiden för AI och Science

dessa förespråkare är fortfarande i en experiment är fortfarande i en experiment. Openai-forskaren Alexander Wei noterade att prestationen representerar en”långvarig stor utmaning i AI”, och tillägger”Jag är glad att dela att vår senaste @openai-experimentella resonemang llm har uppnått en långvarig stormannen före AI: Gold Medal-nivå på världens mest prestigefyllda matematik…”Båda företagen planerar att tillhandahålla tillgång till förtroende testare före alla WIDER. DeepMind uttryckte förtroende för nästa steg och sa:”Vi är mycket säkra på att vi kan ta med [modellen] i händerna på våra pålitliga testare mycket snart, särskilt matematikerna.”Målet är att sätta dessa verktyg i händerna på matematiker för att hjälpa dem att lösa ännu hårdare problem.

Medan det omedelbara fokuset ligger på matematik, är konsekvenserna mycket bredare. En AI som kan resonera med denna nivå av kreativitet och rigoritet kan påskynda upptäckter över vetenskap, teknik och forskning, vilket ger oss ett steg närmare det ultimata målet för AGI.

Categories: IT Info