Meta zmienia punkty bramkowe w wyścigu kodowania AI. Firma opublikowała swój model Code World (CWM), a potężny system 32-billion-parameter zaprojektowany nie tylko do kodu zapisu, ale na fundamentowo it IT, ale na fundament it It It It Fundament It It Im to Prace.

Wydane do badań niekomercyjnych, CWM działa jako „neuronowy debugger”, symulując logikę programu, zanim będzie działać.

To podejście oznacza strategiczne obracanie się, takich jak Google i Openai, którzy ostatnio koncentrowały się na wygraniu konkursów kodowych.

Według badaczy celem

Meta jest wypełnienie luki między tym, co wygląda kod, a tym, co faktycznie robi po wykonaniu. Jak wyjaśnił jeden z badaczy: „Aby kodować master, należy zrozumieć nie tylko to, jak wygląda kod, ale jak się robi po wykonaniu.”

„Neural Debugger”, który symuluje wykonywanie kodu

Unikalne zdolności zdolności CWM wynika z nowatorskiego procesu treningu. Zamiast po prostu analizować kod statyczny, model wyuczony z ponad 120 milionów „śladów wykonania” programów Pythona.

Dane te pozwoliły na obserwowanie zmian krok po kroku w zmiennych programu, nadając mu głęboki, przyczynowo-efektowy model logiki oprogramowania.

Nowy paradygmat treningowy przemieszcza się poza prostym dopasowaniem wzorca. Rozumiejąc konsekwencje każdej linii kodu, CWM może wykonywać zadania poza prostym generowaniem.

Może przewidzieć wyniki programu, identyfikować nieskończone pętle, a nawet analizować złożoność algorytmiczną. To głębsze rozumowanie wyróżnia je w zatłoczonej dziedzinie.

Konkurencyjna wydajność na arenie kodowania AI

Pomimo innego skupienia, CWM posiada swoje kluczowe punkty odniesienia branżowe. W zweryfikowanym przez SWE, wymagającym teście inżynierii oprogramowania rzeczywistego, model osiągnął 53,9% wynik podstawowy, wznosząc się do imponującego 65,8% ze skalowaniem czasu testowego.

Ta wydajność umieszcza go przed wieloma rywalami typu open source o podobnej liczbie parametrów i czyni go konkurencyjnym z znacznie większymi systemami zastrzeżonymi, takimi jak GPT-5 i CLAUDE-4.

Soning. poza jednym testem. Według dokumentu badawczego Meta CWM wykazuje również szerokie kompetencje, zdobywając 68,6% na LiveCodeBench, 96,6% w Math-500 i 76% w AIME 2024 Matematycznej olimpiady.

Ta wszechstronność pokazuje swoje umiejętności rozumowania, nie są ograniczone do wyścigu w wyścigu do budowy więcej ogólnych AG. CWM szczególnie wyróżnia się w zadaniach, które wymagają głębokiego zrozumienia zachowania programu.

O własnej meta BigoBench Benchmark , systematycznie przewyższało konkurencyjne konkurencje w przewidywaniu czasu algorythms, prawidłowej poprawności.

Ponadto, na nowatorskim punkcie odniesienia o nazwie Halteval, CWM osiągnęła niezwykłą 94% dokładności w przewidywaniu, czy program zakończy się, czy utknie w nieskończonej pętli.

Możliwość uzasadnienia przepływu realizacji programu, a nie tylko jego składni, jest podstawowym celem projektowania. Wysoki wynik modelu wynoszący 94,3% w odniesieniu do stóp procentowych dla rozumienia kodu dodatkowo podkreśla powodzenie podejścia Meta.

Doskonałe wyniki w tym zróżnicowanym zestawie punktów odniesienia zorientowanych na obliczenia potwierdza koncentrację na śladach wykonania i cementach CWM pozycji CWM jako potężnego nowego narzędzia do badań AI. (15)

poruszanie się po szerszym „Wojnach porównawczych”

Wpis Meta pojawia się, gdy przemysł zmaga się z ograniczeniami wyników porównawczych. Lato 2025 r. Odbyła się szalona bitwa o pierwsze miejsce na SWE Bench, a Claude Opus 4.1 Anthropika jest zaćmienia przez GPT-5 Openai zaledwie dwa dni później.

Tymczasem XAI „Grok-kode Fast-1″ obraca się, aby nadać prędkość i koszt. Mario Rodriguez z Githuba zauważył, że „we wczesnych testach Kod Grok Fast pokazał zarówno jego prędkość, jak i jakość w zadaniach kodowania agencji.”

Ta dążenie do wysokich wyników, czasami doprowadziło do reakcji, na przykład reakcja Buggy of Gpt-5. Ostatecznie mają więcej niż pozycję tablicy liderów.

Otwarte do badań, ale nie produkcję

Tłem wydania CWM jest krajobraz coraz bardziej wyspecjalizowanych i potężnych narzędzi. Openai niedawno uruchomiła GPT-5-Codex, kodującą wersję GPT-5, która może działać autonomicznie przez wiele godzin.

jej przewód produktu, Alexander Emiricos, podkreślił jego adaptacyjną inteligencję, stwierdzając: „GPT-5-Codex może decydować o pięciu minutach w problem, który musi spędzić kolejną godzinę.”

Trend ten był również określającym ICPC Finals. Bliźnięta wykazało nadludzkie rozwiązywanie problemów.

Dr. Bill Poucher, dyrektor ICPC, sformułował te wyniki jako kluczowy moment, mówiąc: „Bliźnięta z powodzeniem dołączając do tej areny, a osiągnięcie wyników na poziomie złota, oznacza kluczowy moment w definiowaniu narzędzi AI i standardów akademickich potrzebnych dla następnej generacji.”

Meta przyczynia się do tej ewolucji, czyniąc CWM Dostępne dla społeczności badawczej ds. Przytulania twarzy . Model, który może działać na jednym procesorze GPU NVIDIA H100, nie jest dostrojony do czatu ogólnego, podkreślając swój cel jako narzędzie do rozwoju nauki samej AI.

Categories: IT Info