Meta skifter målpostene i AI-kodingsløpet. Selskapet har gitt ut sin Code World Model (CWM), A Forstå hvordan det fungerer.

Utgitt for ikke-kommersiell forskning, fungerer CWM som en”nevral feilsøking”, og simulerer et programs logikk før den noen gang kjører.

Denne tilnærmingen markerer en strategisk pivot fra konkurrenter som Google og Openai, som nylig har fokusert på”å vinne kodingskonkurranse.

p> src=”data: image/svg+xml; nitro-tom-id=mty1mdoxmziw-1; base64, phn2zyb2awv3qm94psiwidagmte2osa4mj Yiihdpzhropsixmty5iiBozwlnahq9ijgyniigeg1sbnm9imH0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Metas mål, ifølge forskerne, er å bygge bro mellom hvordan koden ser ut og hvordan den faktisk gjør når de blir utført. Som en forsker forklarte:”For å mestre koding, må man forstå ikke bare hvordan koden ser ut, men hvordan den gjør når den utføres.”

en”nevral debugger”som simulerer kodeutførelse

CWMs unike kapasitetsstammer fra sin nye treningsprosess. I stedet for bare å analysere statisk kode, lærte modellen fra over 120 millioner”utførelsesspor”av Python-programmer.

Disse dataene tillot den å observere trinn-for-trinn-endringene i programmets variabler, og ga den en dyp, årsak-og-effekt-modell av programvarelogisk.

den nye treningsparadigm-flyttingsmodellen til programvarelogikk.

Det kan forutsi programutfall, identifisere uendelige løkker og til og med analysere algoritmisk kompleksitet. Denne dypere resonnementet er det som skiller den ut i et fullsatt felt.

konkurransedyktig ytelse i AI-kodingsarenaen

Til tross for dets forskjellige fokus, holder CWM sitt eget på viktige bransjens benchmarks. På Swe-Bench bekreftet, en krevende test av den virkelige verdensprogramvareteknikk, oppnådde modellen en basispoeng på 53,9%, og steg til en imponerende 65,8% med testtidsskalering.

Denne ytelsen plasserer det foran deg.

Denne allsidigheten viser at det ikke er en racer. CWM utmerker seg spesielt i oppgaver som krever en dyp forståelse av programatferd.

på Metas egen bigoBen Benchmark , det er systematisk utfanget av sine gebyrer.

Videre oppnådde CWM på en ny referanse kalt Halteval, en bemerkelsesverdig 94% nøyaktighet i å forutsi om et program ville avslutte eller sitte fast i en uendelig sløyfe.

Evnen til å resonnere om et programs utførelsesstrøm, snarere enn bare syntaks, er et kjernedesignmål. Modellens høye poengsum på 94,3% på den cruxevale målestokken for kodeforståelse understreker ytterligere suksessen med Metas tilnærming.

Den sterke ytelsen på tvers av dette mangfoldige settet med beregningsorienterte benchmarks validerer fokuset på utførelser og sement CWMs posisjon som et kraftig nytt verktøy for AI-forskning. (15)

Navigering av de bredere ‘Benchmark Wars’

Metas oppføring kommer når industrien tar tak i begrensningene for referansepoeng. Sommeren 2025 så en hektisk kamp om topplassen på Swe-Bench, med Anthropics Claude Opus 4.1 som ble formørket av Openais GPT-5 bare to dager senere.

I mellomtiden, Xais `Grok-kode-fast-1` pivoted for å prioritere hastigheten og kostnadene, et trekk som anerkjente dyrking av markedsføring-1` pivoted for å prioritere hastigheten og kostnadene. GitHubs Mario Rodriguez bemerket at”I tidlig testing har GROK-koden Fast vist både hastighet og kvalitet i agentkodingsoppgaver.”

Denne jakten på høye poeng Påliteligheten vil til slutt gjøre noe mer enn en topplisteposisjon.

Åpen for forskning, men ikke produksjon

Bakgrunnen for CWMs utgivelse er et landskap med stadig mer spesialiserte og kraftige verktøy. Openai lanserte nylig GPT-5-kode, en kodingsversjon av GPT-5 som kan fungere autonomt i timevis.

Produktledelsen, Alexander Embiricos, fremhevet sin adaptive intelligens, og sa:”GPT-5-kode kan bestemme fem minutter til et problem som den trenger å bruke en time.”

denne trenden mot en avansert som den trenger å bruke en annen time. Gemini demonstrerte overmenneskelig problemløsing.

dr. Bill Poucher, ICPC-direktøren, innrammet disse resultatene som et sentralt øyeblikk, og sa:”Gemini med suksess med å bli med på denne arenaen, og oppnå resultater på gullnivå, markerer et sentralt øyeblikk i å definere AI-verktøyene og akademiske standarder som trengs for neste generasjon.”

meta er bidrar til denne utviklingen ved å gjøre CWMM. href=”https://huggingface.co/facebook/cwm”Target=”_ Blank”> Tilgjengelig for forskningssamfunnet på Hugging Face . Modellen, som kan kjøre på en enkelt NVIDIA H100 GPU, er ikke innstilt for generell chat, og understreker formålet som et verktøy for å fremme vitenskapen om AI selv.

Categories: IT Info