meta flyttar målposterna i AI-kodningsloppet. Företaget har släppt sin Code World Model (CWM), A kraftfulla 32-billion-parameter fungerar.

Släppt för icke-kommersiell forskning, CWM fungerar som en”neural felsökare”, som simulerar ett programs logik innan det någonsin körs.

Detta tillvägagångssätt markerar en strategisk pivot från konkurrenter som Google och OpenAI, som nyligen har fokuserat på att vinna kodningstävlingar. src=”https://winbuzzer.com/wp-content/uploads/2025/09/meta-code-world-model-cwm-benchmarks.jpg”höjden=”826″>

metas mål, enligt dess forskare, är att överbrygga gapen mellan hur kod ser ut som och hur det faktiskt gör när det faktiskt ser ut när det faktiskt ser ut när det faktiskt ser ut när det faktiskt ser ut när det faktiskt ser ut när det gäller när det gäller att uteslutande. Som en forskare förklarade:”För att behärska kodning måste man inte bara förstå hur kod ser ut utan hur den gör när den körs.”

En”neural felsökare”som simulerar kodutförande

CWM: s unika kapacitet härstammar från sin nya träningsprocess. I stället för att bara analysera statisk kod, lärde modellen från över 120 miljoner”exekveringsspår”av Python-program.

Dessa data tillät den att observera steg-för-steg-förändringar i ett programs variabler, vilket ger det en djup, orsak-och-effektmodell för mjukvarulogik.

de nya träningsparadigmröret rör sig bort enkla mönster. Genom att förstå konsekvenserna av varje kodrad kan CWM utföra uppgifter utöver enkel generation.

Det kan förutsäga programresultat, identifiera oändliga slingor och till och med analysera algoritmisk komplexitet. Detta djupare resonemang är det som skiljer det i ett trångt fält.

Konkurrenskraftig prestanda i AI-kodningsarenan

Trots sitt olika fokus har CWM sin egen på viktiga branschens riktmärken. På Swe-Bench Verified, ett krävande test av mjukvaruteknik för verklig värld, uppnådde modellen en 53,9% baspoäng, och ökade till en imponerande 65,8% med testtidsskalning.

Denna prestanda placerar den framför många öppna-source-rivaler med liknande parameternivån och gör det konkurrenskraftigt med mycket större propriety-system som GPT-5 och claude-4. långt bortom ett enda test. Enligt Metas forskningsdokument visar CWM också bred kompetens genom att göra 68,6% på LiveCodebench, 96,6% på Math-500, och 76% på AIME 2024 MATEMATISKA OLYMPIAD. CWM utmärker sig särskilt i uppgifter som kräver en djup förståelse för programbeteende.

på Metas egen Bigobench Benchmark , det systematiskt överträffade konkurrenterna i predicing-tidskomplexitet

Vidare, på ett nytt riktmärke som kallas Halteval, uppnådde CWM en anmärkningsvärd 94% noggrannhet när det gäller att förutsäga om ett program skulle avsluta eller fastna i en oändlig slinga.

Möjligheten att resonera om ett programs exekveringsflöde, snarare än bara dess syntax, är en kärndesignmål. Modellens höga poäng på 94,3% på det cruxevala riktmärket för kodförståelse understryker ytterligare framgången för Metas tillvägagångssätt.

Den starka prestandan i denna mångfaldiga uppsättning beräkningsorienterade riktmärken validerar fokus på exekveringsspår och cements CWM: s position som en kraftfull ny verktyg för AI-forskning. (15)

navigera i de bredare”benchmark wars”

metas inträde kommer när branschen kämpar med begränsningarna i referenspoäng. Sommaren 2025 såg en hektisk kamp för topplatsen på Swe-Bench, med Anthropics Claude Opus 4.1 som förmörkades av OpenAI: s GPT-5 bara två dagar senare.

Under tiden, Xai’s”Grok-Code-Fast-1` pivoted för att prioritera hastighet och kostade, ett drag som AcKnedged Growing Marknads Skepticism Benchmark ledde. GitHub’s Mario Rodriguez noted that “in early testing, Grok Code Fast has shown both its speed and quality in agentic coding tasks.”

This pursuit of high scores has sometimes led to real-world stumbles, such as the buggy launch of GPT-5.

Meta’s focus on robust, underlying logic with CWM appears to be a direct response, betting that reliability will ultimately matter more än en topplista. OpenAI recently launched GPT-5-Codex, a coding version of GPT-5 that can work autonomously for hours.

Its product lead, Alexander Embiricos, highlighted its adaptive intelligence, stating, “GPT-5-Codex can decide five minutes into a problem that it needs to spend another hour.”

This trend toward advanced reasoning was also showcased at the ICPC World Finals, where Googles Tvillingarna visade övermänsklig problemlösning.

dr. Bill Poucher, ICPC-direktören, inramade dessa resultat som ett avgörande ögonblick och säger:”Gemini framgångsrikt gå med i denna arena, och att uppnå resultat på guldnivå, markerar ett viktigt ögonblick för att definiera AI-verktyg och akademiska standarder som behövs för nästa generation.”

Meta bidrar till denna utveckling genom att göra CWM Tillgänglig för forskarsamhället om att krama ansiktet . Modellen, som kan köras på en enda NVIDIA H100 GPU, är inte inställd för allmän chatt och understryker sitt syfte som ett verktyg för att främja AI-vetenskapen.

Categories: IT Info