fra sølv til gull: et sprang i AI-resonnement
Denne prestasjonen representerer et monumentalt fremskritt over Googles ytelse bare i fjor. I 2024 nådde systemene en sølvmedalje-standard, men
Dette sprang fremover fjerner behovet for eksperter for å oversette problemer til formelle språk som Lean, en tungvinnelig prosess som tidligere begrenset systemets hastighet og autonomi. Det viser en mer fleksibel og kraftig form for AI-resonnement.
Rase for å bygge en ekte AI-matematiker
Begge selskapene rammer ut sine prestasjoner som en seier for generell-AI. Openai-forskeren Noam Brown la vekt på,”Dette er ikke en IMO-spesifikk modell. Det er en resonnement LLM som inkluderer nye eksperimentelle generelle teknikker,”et sentiment som gjentas av kollegene. Dette antyder at de underliggende modellene er stort sett dyktige, ikke bare smale matematikkspesialister.
Googles system er avhengig av den nye dype tenkarkitekturen. Denne modusen inkluderer parallell tenking, slik at modellen kan utforske og kombinere flere potensielle løsningsveier samtidig, i stedet for å forfølge en enkelt, lineær tankekede.
Openais flytting for å selvrapportere resultatene fremhever det intense presset for å demonstrere ledelse, spesielt i en periode med interne bedriftsutfordringer. For Openai, å oppnå det administrerende direktør Sam Altman kalte en”drøm”,”da vi først startet Openai, var dette en drøm, men ikke en som føltes veldig realistisk for oss,”fungerer som en kraftig tilbakevisning for fortellinger om at et selskap mister sin kant. /strong>
hva dette betyr for fremtiden til AI og vitenskap
hva dette betyr for fremtiden til AI og vitenskapen
Mens det umiddelbare fokuset er på matematikk, er implikasjonene langt bredere. En AI som kan resonnere med dette kreativitetsnivået og strengheten kan fremskynde funn på tvers av vitenskap, ingeniørfag og forskning, og bringe oss et skritt nærmere det endelige målet for AGI.