AI-oppstart Cognition har avduket sin nyeste modell, kalt Devin, en fullstendig autonom AI-programvareingeniør. Utviklet med støtte fra innflytelsesrike støttespillere, inkludert Peter Thiels Founders Fund, Elad Gil, en tidligere leder i Twitter, og Tony Xu, medgründer av DoorDash, Devin presenterer en banebrytende tilnærming til koding. I motsetning til eksisterende kodeassistenter som tilbyr grunnleggende kodeskriving eller forslag til kodebiter, kan Cognition Devin overvåke et prosjekt fra den første kodefasen til utførelse, adressere feil og distribuere oppdateringer autonomt.

Operasjonell innsikt i Devin

Devins operasjonelle metodikk begynner med å tolke brukerforespørsler, etterfulgt av å formulere en detaljert utførelsesplan. Ved å bruke standard utviklerverktøy i en sandkasse-innstilling, etterligner Devins operasjoner de til menneskelige kodere, om enn i et akselerert tempo. Den skriver kode autonomt, feilsøker, utfører testing og oppdaterer fremdriften i sanntid. Devins evne til autonomt å korrigere problemer ved brukerintervensjon understreker ytterligere potensialet som en selvforsynt prosjektsamarbeidspartner, og frigjør menneskelige ingeniører til å fokusere på mer kreative bestrebelser.

I dag er vi glade for å introdusere Devin , den første AI-programvareingeniøren.

Devin er den nye state-of-the-art på SWE-Bench-kodingsreferansen, har bestått praktiske ingeniørintervjuer fra ledende AI-selskaper, og har til og med fullført ekte jobber på Upwork.

Devin er… pic.twitter.com/ladBicxEat

— Kognisjon (@cognition_labs) 12. mars 2024

Scott Wu, administrerende direktør i Cognition og kjent for sine prestasjoner innen sportskoding, skisserte Devins evne til å operere i et sikkert datamiljø, navigerer gjennom ulike utviklerverktøy. Devin er designet for å forstå naturlige språkinndata og lage strategier for å møte kodingsutfordringer. Den demonstrerer ferdigheter i oppgaver som spenner fra app-og nettsteddistribusjon til feilretting og til og med håndtering av komplekse operasjoner som finjustering av store språkmodeller. I tester som SWE-benken, har Devin vist overlegen ytelse sammenlignet med andre AI-modeller som Claude 2, SWE-Llama-13b, og GPT-4 ved autonomt å løse et betydelig antall kodingsproblemer.

Et sprang utover tradisjonelle kodingshjelpemidler

AI-ekspert Wes Roth publiserte en oversikt over Devin som fremhever potensialet til den nye AI-modellen. Han antyder at det kan være den første kommersielt tilgjengelige kunstige generelle intelligensen (AGI). Med lanseringen av Devin tar Cognition sikte på å endre paradigmet i den AI-assisterte kodingsindustrien. Devin fremmer konseptet med utviklerverktøy som GitHubs Copilot ved å tilby ikke bare assistanse, men komplette prosjektgjennomføringsevner.

[innebygd innhold]

Gjennom demonstrasjoner viste Cognitions Scott Wu hvordan Devin nærmer seg komplekst koding av prosjekter og dataforskningsoppgaver systematisk. Devins design gjør at den autonomt kan oppsøke læringsressurser på nettet for å forstå og utføre oppgavene den er tildelt, inkludert feilsøking av problemer. Dette nivået av autonomi hos en AI-ingeniør antyder en ny retning for kodingsindustrien, der AI uavhengig kan håndtere komplette prosjekter.

Categories: IT Info