Løpet om AI-overherredømme har nådd en ny topp, ettersom både Google DeepMind og Openai nå hevder at modellene deres kan erobre den internasjonale matematiske olympiaden (IMO), en av menneskehetens tøffeste intellektuelle utfordringer.

Google kunngjorde på mandag at dens Gemini Deep Think Ai

Dette gjennombruddet signaliserer et dramatisk sprang i AI-resonnement. Det beviser at generelle-purposemodeller nå kan løse komplekse matematiske problemer på et elite menneskelig nivå, og eskalerer rivaliseringen mellom de to AI-lederne.

Gold Medal Threshold for denne årets Results

IMO-president prof. Dr. Gregor Dolinar bekreftet prestasjonen og uttalte:”Vi kan bekrefte at Google DeepMind har nådd den mye ønsket milepæl, og tjente 35 av mulige 42 poeng-en gullmedaljescore. Løsningene deres var forbløffende på mange måter.”Imidlertid klargjorde IMOs offisielle uttalelse den bare

fra sølv til gull: et sprang i AI-resonnement

Denne prestasjonen representerer et monumentalt fremskritt over Googles ytelse bare i fjor. I 2024 nådde systemene en sølvmedalje-standard, men

Dette sprang fremover fjerner behovet for eksperter for å oversette problemer til formelle språk som Lean, en tungvinnelig prosess som tidligere begrenset systemets hastighet og autonomi. Det viser en mer fleksibel og kraftig form for AI-resonnement.

Rase for å bygge en ekte AI-matematiker

Begge selskapene rammer ut sine prestasjoner som en seier for generell-AI. Openai-forskeren Noam Brown la vekt på,”Dette er ikke en IMO-spesifikk modell. Det er en resonnement LLM som inkluderer nye eksperimentelle generelle teknikker,”et sentiment som gjentas av kollegene. Dette antyder at de underliggende modellene er stort sett dyktige, ikke bare smale matematikkspesialister.

Googles system er avhengig av den nye dype tenkarkitekturen. Denne modusen inkluderer parallell tenking, slik at modellen kan utforske og kombinere flere potensielle løsningsveier samtidig, i stedet for å forfølge en enkelt, lineær tankekede.

Openais flytting for å selvrapportere resultatene fremhever det intense presset for å demonstrere ledelse, spesielt i en periode med interne bedriftsutfordringer. For Openai, å oppnå det administrerende direktør Sam Altman kalte en”drøm”,”da vi først startet Openai, var dette en drøm, men ikke en som føltes veldig realistisk for oss,”fungerer som en kraftig tilbakevisning for fortellinger om at et selskap mister sin kant.

hva dette betyr for fremtiden til AI og vitenskap

hva dette betyr for fremtiden til AI og vitenskapen

Mens det umiddelbare fokuset er på matematikk, er implikasjonene langt bredere. En AI som kan resonnere med dette kreativitetsnivået og strengheten kan fremskynde funn på tvers av vitenskap, ingeniørfag og forskning, og bringe oss et skritt nærmere det endelige målet for AGI.