Cognition, laboratorium sztucznej inteligencji stojące za agentem Devin, uruchomiło SWE-1.5, nowy model szybkiego kodowania, który stanowi wyzwanie dla rynku, traktując priorytetowo zarówno wydajność, jak i szybkość.

Model, ogłoszony 29 października, jest teraz dostępny w środowisku Windsurf IDE nabytym w lipcu przez firmę Cognition. Firma twierdzi, że SWE-1.5 działa do 13 razy szybciej niż Sonnet 4.5 firmy Anthropic dzięki partnerstwu z dostawcą wnioskowania Cerebras.

Wydanie następuje po wprowadzeniu przez konkurencyjnego Cursora własnego, szybkiego modelu, Composer, sygnalizując nowy trend, w ramach którego firmy agentów AI budują własne modele w celu tworzenia ściśle zintegrowanych środowisk programistycznych o niskim opóźnieniu i zmniejszania zależności od interfejsów API innych firm.

Nowy standard szybkości i inteligencji

W posunięciu, które bezpośrednio odzwierciedla konkurencję, Cognition stawia na integrację pionową, aby rozwiązać podstawową frustrację programistów: kompromis między inteligencją modelu a czasem reakcji.

Strategia firmy opiera się na idei wspólnego projektowania modelu, jego systemu wnioskowania i wiązki agentów jako jednego, ujednoliconego systemu.

Zgodnie ze oficjalne ogłoszenie: „Programiści nie powinni wybierać między sztuczną inteligencją, która myśli szybko a tą, która myśli dobrze.”

Ta filozofia leży u podstaw SWE-1.5, które Cognition opisuje jako model „pogranicza” z setkami miliardów parametrów, zaprojektowany specjalnie w celu wyeliminowania tego kompromisu i zapewnienia zarówno elitarnej, jak i najlepszej w swojej klasie wydajności prędkość.

Najbardziej uderzającą cechą modelu jest jego ogromna prędkość, będąca wynikiem ścisłej współpracy ze specjalistą od wnioskowania Cerebras. Cognition twierdzi, że ta współpraca pozwala SWE-1.5 osiągnąć niezwykłe opóźnienia, stwierdzając: „Ustanawia także nowy standard szybkości: nawiązaliśmy współpracę z Cerebras, aby obsługiwać go z prędkością do 950 tok/s – 6 razy szybciej niż Haiku 4.5 i 13 razy szybciej niż Sonnet 4.5.”

Ten skok wydajności ma na celu utrzymanie programistów w „stanie przepływu” poprzez wykonywanie zadań w czasie krótszym niż pięć sekund, co jest krytycznym progiem pozwalającym uniknąć tego, co firma nazywa „półasynchroniczna dolina śmierci”.

Wysiłki optymalizacyjne wykraczały poza sam model, ponieważ jego prędkość ujawniła nowe wąskie gardła w Windsurf IDE, co zmusiło zespół do przepisania kluczowych komponentów, takich jak sprawdzanie lintowania i potoki wykonywania poleceń, aby zmniejszyć obciążenie systemu nawet o dwie sekundy na krok.

Chociaż twierdzenia Cognition dotyczące szybkości są odważne, firma dostarczyła również dane z testu porównawczego SWE-Bench Pro do uzasadnić jego wydajność.

W teście porównawczym, który składa się z 731 trudnych zadań kodowania agentycznego w 41 różnych repozytoriach kodu, SWE-1.5 demonstruje kompromis, który ma pokonać.

Chociaż Sonnet 4.5 firmy Anthropic osiągnął najwyższy wynik na poziomie 43,60%, zrobił to przy prędkości zaledwie 69 tokenów na sekundę. Dla kontrastu, SWE-1.5 uzyskał bardzo konkurencyjny wynik 40,08% – osiągając wydajność niemal graniczną – ale przy zawrotnej prędkości 950 tokenów na sekundę, co czyni go prawie 14 razy szybszym.

To pozycjonuje ten model jako potężne narzędzie dla programistów, którzy potrzebują wysokiej jakości wyników bez opóźnień zakłócających pracę innych czołowych modeli.

Wyniki testów porównawczych pokazują, że SWE-1.5 przewyższa kilka innych godne uwagi modele zarówno pod względem dokładności, jak i szybkości. Przewyższył Haiku 4.5 firmy Anthropic (39,45% wyniku przy 142 tok/s) i wysokopoziomową wersję GPT-5 (36,30% wyniku przy 43 tok/s).

Nowy model stanowi także ogromny skok generacyjny dla Cognition, uzyskując ponad dwukrotnie więcej punktów niż jego poprzednik, SWE-1, który uzyskał zaledwie 16,55% przy 39 tok/s. T

jego dane potwierdzają główny argument Cognition: SWE-1.5 zapewnia wydajność konkurencyjną w stosunku do najlepszych na rynku, wyznaczając jednocześnie zupełnie nowy standard szybkości.

U podstaw nowego modelu leży ogromna inwestycja w najnowocześniejszą infrastrukturę. Firma Cognition ujawnia, że SWE-1.5 została przeszkolona na „najnowocześniejszym klastrze złożonym z tysięcy chipów GB200 NVL72″ i twierdzi, że może to być „pierwszy publiczny model produkcyjny wytrenowany na nowej generacji GB200″.

Dostęp do sprzętu na początku czerwca, kiedy oprogramowanie sprzętowe było jeszcze niedojrzałe, wymagało od zespołu zbudowania od podstaw solidniejszych systemów szkoleniowych sprawdzających stan zdrowia i odpornych na awarie.

To potężny sprzęt był niezbędny do stosowania technik intensywnego uczenia się przez wzmacnianie (RL) stosowanych w celu dostrojenia modelu specjalnie pod kątem złożonych, wieloetapowych zadań związanych z nowoczesną inżynierią oprogramowania.

Wpływ wzmocnienia

Wprowadzenie SWE-1.5 następuje w momencie, gdy środowisko kodowania AI Cursor wypuściło swój własny, zastrzeżony, szybki model Composer.

Podobieństwa między tymi dwoma ogłoszeniami są nie do zignorowania i nie mogą wskazywać na jasną strategię konwergencja na rynku narzędzi dla programistów AI.

Obie firmy wdrażają uczenie się przez wzmacnianie na masową skalę. Cognition wykorzystało hiperwizora maszyn wirtualnych o nazwie otterlink do uruchamiania wdrożeń RL w dziesiątkach tysięcy równoczesnych środowisk o wysokiej jakości, które obejmują wykonywanie kodu i przeglądanie stron internetowych.

Ta metoda jest uderzająco podobna do opisu Cursora dotyczącego uruchamiania „setek tysięcy jednoczesnych środowisk kodowania w piaskownicy” na potrzeby własnego szkolenia RL.

To wspólne podejście podkreśla rosnące przekonanie, że aby zbudować naprawdę skutecznego agenta kodowania, firmy muszą dopasowuj modele do własnych, niestandardowych narzędzi i scenariuszy ze świata rzeczywistego.

Badacz Cursor ML sformułował tę strategię, stwierdzając: „Oto minimalna ilość inteligencji, która jest niezbędna do produktywności, a jeśli można ją połączyć z szybkością, jest niesamowita.”

Kolejnym podobieństwem jest brak przejrzystości. Zarówno Cognition, jak i Cursor utrzymywały tajemnicę na temat podstaw swoich nowych modeli, odnosząc się jedynie do „wiodącego modelu bazowego typu open source”.

Ta tajemnica utrudnia niezależną ocenę i wymaga zaufania użytkowników do wewnętrznych testów porównawczych firm. Jednak pierwsze wrażenia są pozytywne. Ekspert ds. sztucznej inteligencji i bloger Simon Willison zauważył po przetestowaniu nowego modelu: „Ten wydawał się naprawdę szybki. Współpraca z Cerebras w zakresie wnioskowania to bardzo sprytne posunięcie”.

Z popiołów windsurfingu – nowa strategia

Wykorzystanie Dzięki aktywom wynikającym z głośnego przejęcia firmy Windsurf, Cognition opiera się na uznanej marce i produkcie.

Nowy model jest ewolucją rodziny SWE (Software Engineering), projektu zainicjowanego przez pierwotny zespół Windsurf w maju 2025 r., zanim jego planowane przejęcie przez OpenAI upadło, a Cognition wkroczyło jako ratunek.

Dzięki integracji SWE-1.5 bezpośrednio z Windsurf IDE, Cognition jest realizacja wizji współprojektowania modelu, wiązki agentów i doświadczenia użytkownika jako jednego, ujednoliconego systemu. Firma twierdzi, że to holistyczne podejście ma kluczowe znaczenie dla wydajności.

W swoim ogłoszeniu firma Cognition wyjaśniła: „Wybór agenta kodującego nie dotyczy samego modelu. Otaczająca orkiestracja ma również ogromny wpływ na działanie modelu”.

Ta strategia pozwala firmie na szybkie iteracje, wykorzystując informacje zwrotne ze środowiska Windsurf do dostosowywania narzędzi i podpowiedzi, a następnie ponowne szkolenie modelu w zaktualizowanym systemie.

To strategia Założę się, że ściśle zintegrowane, szybkie rozwiązanie może stworzyć lojalną bazę użytkowników, nawet bez posiadania absolutnie największego modelu na rynku. W miarę nasilania się bitwy o komputery stacjonarne programistów zdolność do zapewnienia zarówno inteligencji, jak i szybkości w ramach płynnego przepływu pracy może stać się kluczowym wyróżnikiem.

Categories: IT Info