Cognition, AI-laboratoriet bak Devin-agenten, har lansert SWE-1.5, en ny høyhastighets kodemodell som utfordrer markedet ved å prioritere både ytelse og hastighet.

Annonsert 29. oktober er modellen nå tilgjengelig i Windsurf IDE, som Cognition kjøpte i juli. Selskapet hevder at SWE-1.5 opererer opptil 13 ganger raskere enn Anthropics Sonnet 4.5, takket være et partnerskap med inferensleverandøren Cerebras.

Utgivelsen kommer da rivalen Cursor lanserte sin egen raske modell, Composer, som signaliserer en ny trend der AI-agentselskaper utvikler proprietære modeller for å skape lavtight-integrerte tredjeparts avhengighet og erfaring. APIer.

En ny standard for hastighet og intelligens

I et trekk som direkte gjenspeiler konkurrentene, satser Cognition på vertikal integrasjon for å løse en kjerneutviklerfrustrasjon: avveiningen mellom modellintelligens og responstid.

Bedriftens strategi er bygget på ideen om en modell, og at dets samdesigner systemet, samdesignet, unified agenten. system.

I følge selskapets offisielle kunngjøring,”Utviklere skal ikke måtte velge mellom en AI som tenker raskt og en som tenker godt.”

Denne filosofien underbygger SWE-1. hundrevis av milliarder av parametere, spesielt utviklet for å eliminere dette kompromisset og levere både eliteytelse og klassens beste hastighet.

Modellens mest slående funksjon er dens råhastighet, et resultat av et nært samarbeid med inferensspesialisten Cerebras. Cognition hevder at dette samarbeidet gjør at SWE-1.5 kan oppnå bemerkelsesverdig ventetid, og sier:”Det setter også en ny standard for hastighet: vi samarbeidet med Cerebras for å betjene den med opptil 950 tok/s – 6 ganger raskere enn Haiku 4.5 og 13 ganger raskere enn Sonnet 4.5.”

Denne flyttilstanden utvikler seg i en oppgave med å sikte på fem. sekunder, en kritisk terskel for å unngå det selskapet kaller”den semi-asynkrone dødsdalen.”

Optimaliseringsinnsatsen gikk utover selve modellen, da hastigheten avslørte nye flaskehalser i Windsurf IDE, som tvang teamet til å omskrive kritiske komponenter som lokontroll og kommandoutførelsespipelines for å redusere systemoverhead-trinn per opp

. Cognitions hastighetspåstander er dristige, selskapet ga også data fra SWE-Bench Pro-referansen for å underbygge ytelsen.

På benchmarken, som består av 731 vanskelige agentkodingsoppgaver på tvers av 41 forskjellige kodelagre, demonstrerer SWE-1.5 avveiningen den tar sikte på å oppnå ved Sonnile.

When. 43,60 %, det gjorde det med en hastighet på bare 69 tokens/sekund. I motsetning til dette leverte SWE-1.5 en svært konkurransedyktig poengsum på 40,08 % – og oppnådde ytelse nær grensen – men med enestående 950 tokens/sekund, noe som gjør den nesten 14 ganger raskere.

Dette posisjonerer modellen som et kraftig verktøy for utviklere som trenger resultater av høy kvalitet uten arbeidsflyt-modellen som avbryter resultatene fra andre referansenivåer p. SWE-1.5 overgår flere andre bemerkelsesverdige modeller i både nøyaktighet og hastighet. Den overgikk Anthropics Haiku 4,5 (39,45 % poengsum ved 142 tok/s) og en høynivåversjon av GPT-5 (36,30 % poengsum ved 43 tok/s).

Den nye modellen representerer også et enormt generasjonssprang for Cognition, og scoret mer enn doblet forgjengeren, SWE-9, som kun klarte 5%/1. T

dataene hans forsterker Cognitions sentrale argument: SWE-1.5 leverer ytelse som er konkurransedyktig med markedets beste, samtidig som den setter en helt ny standard for hastighet.

Den nye modellen ligger til grunn for en massiv investering i banebrytende infrastruktur. Cognition avslører at SWE-1.5 ble trent på en”state-of-the-art klynge av tusenvis av GB200 NVL72-brikker,”og hevder at det kan være den”første offentlige produksjonsmodellen som ble trent på den nye GB200-generasjonen.”

Å få tilgang til maskinvaren i begynnelsen av juni, da fastvaren fortsatt var umodent til å sjekke bakken til å bygge mer robuste systemer, krevde helseteamet fra robuste systemer. opp.

Denne kraftige maskinvaren var essensiell for de intensive forsterkningslæringsteknikkene (RL) som ble brukt til å finjustere modellen spesifikt for de komplekse, flertrinnsoppgavene som er involvert i moderne programvareteknikk.

The Impact of Reinforcement

Lanseringen av SWE-1.5 kommer som en proprietær AI-kodingsmodell

.

Parallellene mellom de to kunngjøringene er umulige å ignorere og peker på en klar strategisk konvergens i markedet for AI-utviklerverktøy.

Begge selskaper omfavner forsterkende læring i massiv skala. Kognisjon brukte en VM-hypervisor kalt otterlink for å kjøre RL-utrullinger i titusenvis av samtidige, høykvalitetsmiljøer som inkluderer kjøring av kode og nettsurfing.

Denne metoden er slående lik Cursors beskrivelse av å kjøre «hundretusenvis av samtidige sandkasse-kodingsmiljøer» for sin egen delte tilnærming .

at for å bygge en virkelig effektiv kodeagent, må bedrifter finjustere modellene mot sine egne tilpassede verktøy og scenarier i den virkelige verden.

En Cursor ML-forsker formulerte denne strategien og sa: «her er en nå minimal mengde intelligens som er nødvendig for å være produktiv, og at hvis du kan koble det med hastighet, er det fantastisk.»

En annen mangel på åpenhet. Både Cognition og Cursor har vært hemmelighetsfulle om grunnlaget for deres nye modeller, og referert kun til en”ledende åpen kildekode-basemodell.”

Denne hemmeligholdelsen gjør uavhengig vurdering vanskelig og er avhengig av at brukerne stoler på selskapenes interne benchmarks. Tidlige inntrykk er imidlertid positive. AI-ekspert og blogger Simon Willison bemerket etter å ha testet den nye modellen:”Denne føltes veldig fort. Å samarbeide med Cerebras for slutninger er et veldig smart trekk.”

From Ashsurf, a New Windsurf,>

Cognition bygger på eiendelene fra det høyprofilerte oppkjøpet av Windsurf og bygger på et etablert merke og produkt.

Den nye modellen er en videreutvikling av SWE-familien (Software Engineering), et prosjekt initiert av det opprinnelige Windsurf-teamet tilbake i mai 2025, før det planlagte oppkjøpet gikk inn av OpenAI rescuerer.

Ved å integrere SWE-1.5 direkte i Windsurf IDE, utfører Cognition en visjon om å samdesigne modellen, agentselen og brukeropplevelsen som et enkelt, enhetlig system. Selskapet argumenterer for at denne helhetlige tilnærmingen er avgjørende for ytelse.

I sin kunngjøring forklarte Cognition:”Å velge en kodingsagent handler ikke bare om selve modellen. Den omkringliggende orkestreringen har også en overordnet innvirkning på hvordan modellen presterer.”

Denne strategien gjør det mulig for selskapet å raskt iterere, ved å bruke tilbakemeldinger fra vinden, og deretter trene omgivelsene på nytt for å justere verktøyene og deretter trene opp modellen på nytt. oppdatert system.

Det er en innsats at en tett integrert høyhastighetsopplevelse kan skape en lojal brukerbase, selv uten å ha den absolutt største modellen på markedet. Etter hvert som kampen om utviklernes stasjonære datamaskiner intensiveres, kan evnen til å levere både intelligens og hastighet innenfor en sømløs arbeidsflyt bli den viktigste forskjellen.

Categories: IT Info