Antropic ka lançuar Claude Sonnet 4.5, modelin e tij të fundit të AI, për të cilin kompania pretendon se është modeli më i mirë dhe më i sigurt në botë për kodimin dhe ndërtimin e agjentëve komplekse të softuerit. Claude Sonnet 4.5 demonstron performancën më të lartë në standardet kryesore të industrisë. Nisja përfshin azhurnime të mëdha në mjetet e zhvilluesve të Antropic, të tilla si një zgjatje e re VS Code dhe një agjent SDK, që synon të mundësojë detyra autonome më të sofistikuara, me kohëzgjatje të gjatë. href=”https://www.anthropic.com/claude-sonnet-4-5-system-card”target=”_ bosh”> zbut rreziqet dhe zvogëlon sjelljet e dëmshme . Kjo lëvizje e pozicionon atë si një partner më i besueshëm dhe më i lidhur me AI për zhvilluesit në një garë teknologjike të përshkallëzuar me shpejtësi.

Një pikë referimi i ri për kodimin e AI dhe qëndrueshmërinë agjentike

Pretendimet e antropikut për epërsi janë mbështetur nga një listë e metrikës mbresëlënëse që pozicionojnë Sonnet 4.5 në krye të disa drejtuesve kryesorë të industrisë. href=”https://www.anthropic.com/news/claude-sonnet-4-5″target=”_ bosh”> Njoftim zyrtar nxjerr në pah performancën e tij të programeve të botës së botës, të kërkuara si SWE-Bench.

Modeli gjithashtu vendosi një rekord të ri në Osworld, një suitë që teston aftësinë e një AI për të kryer detyra praktike, në botën reale të kompjuterit. Kjo performancë e vendos atë përpara konkurrentëve si Google’s Gemini 2.5 Pro dhe GPT-5 të Openai në fronte të shumta, sipas standardeve të ndara nga kompania.

Kjo kërcim i performancës nuk është vetëm rritës; Veçanërisht tejkalon modelin më të shtrenjtë të flamurit të Antropikut, Opus 4.1. Duke ofruar aftësi superiore në të njëjtën pikë çmimi si Sonet 4 më i vjetër, Antropik po bën një rast të fortë për efikasitetin dhe vlerën, duke ofruar zhvilluesve qasje në performancën e nivelit të lartë pa një premium të kostos. Antropik raporton që Sonnet 4.5 mund të funksionojë në projekte komplekse, me shumë hapa për mbi 30 orë vazhdimisht. Gjatë provave të hershme, studiuesi antropik i AI David Hershey i tha TechCrunch se ai vëzhgoi modelin jo vetëm që të ndërtonte një aplikim, por gjithashtu të ngrihej në shërbime të bazës së të dhënave, të blinte emra domain, dhe të kryejë një auditim të sigurisë SOC 2 në punën e vet. tregon gjerësi më të madhe. Reagimet e hershme nga ekspertët në financa, ligjin, mjekësinë dhe STEM zbuluan se Sonnet 4.5 ka njohuri dhe arsyetim në mënyrë dramatike më të mirë të domenit sesa modelet e mëparshme. Siç vuri në dukje Hershey, është e vështirë të kapësh performancën e Claude Sonnet 4.5 vetëm në standardet, duke theksuar aftësinë e modelit për të trajtuar sfidat e botës reale, të horizonit të gjatë që shkojnë përtej gjenerimit të thjeshtë të kodit. Ekosistemi i zhvilluesit. Kompania ka rrokullisur një suitë të mjeteve të reja të fuqishme dhe karakteristika të dizajnuara për të bërë ndërtimin me Claude më të robit dhe autonome, duke adresuar direkt pikat e dhimbjes kryesore të zhvillimit. Agjenti popullor i kodimit të kompanisë. Tani ai përfshin”pikat e kontrollit”, një veçori shumë të kërkuar që ruan automatikisht gjendjen e kodit para çdo ndryshimi. href=”https://marketplace.visualstudio.com/items?tiemname=anthropic.claude-code”target=”_ bosh”> shtrirja e vendasve vs code , aktualisht në beta. Kjo sjell aftësitë e Claude Code direkt në IDE, duke ofruar një ndërfaqe më të pasur, grafike me një shirit anësor të dedikuar dhe në kohë reale ndryshojnë. href=”https://www.anthropic.com/news/context-management”target=”_ bosh”> mjete të avancuara të menaxhimit të kontekstit . Qasja me dy drejtime ka një ndikim të matshëm. Testet e brendshme treguan se kombinimi i këtyre mjeteve përmirësoi performancën e agjentit në detyra komplekse me 39% dhe uljen e konsumit të shenja href=”https://anthropic.com/engineering/building-agents-with-the-claude-agent-sdk”target=”_ bosh”> duke lëshuar agjentin e Claude sdk . Kjo nuk është vetëm një bibliotekë; Ai u jep zhvilluesve qasje në të njëjtën infrastrukturë thelbësore që fuqizon kodin Claude. Ai mundëson krijimin e agjentëve me porosi për flukset e specializuara të punës, nga pajtueshmëria financiare deri tek siguria në internet.

Kjo strategji mbështet drejtpërdrejt vizionin afatgjatë të kompanisë. Siç tha CEO Dario Amodei më parë,”Ne po shkojmë drejt një bote ku një zhvillues njerëzor mund të menaxhojë një flotë agjentësh, por unë mendoj se përfshirja e vazhdueshme e njeriut do të jetë e rëndësishme për kontrollin e cilësisë…”SDK-ja e re është një hap themelor drejt bërjes së këtij vizioni për të gjithë zhvilluesit. Sonnet 4.5 si”modeli më i rreshtuar i kufirit akoma”. Karta zyrtare e sistemit të kompanisë detajon trajnime të gjera të sigurisë që ka çuar në ulje të konsiderueshme të sjelljeve të padëshirueshme si sykofantia, mashtrimi dhe kërkimi i energjisë. Kjo përfshin vendosjen e filtrave të dizajnuar për të zbuluar dhe parandaluar gjenerimin e rezultateve potencialisht të rrezikshme, veçanërisht ato që lidhen me armët kimike, biologjike, radiologjike dhe bërthamore (CBRN). Kompania pretendon se SONET 4.5 është dukshëm më pak e prirur për të nxitur sulme me injeksion dhe dobësi të tjera që kanë rrënuar gjeneratat e mëparshme të modeleve AI. Shtë një veprim strategjik në një treg hiper-konkurrues. Vetëm disa javë më parë, Openai filloi GPT-5-Kodex, një model i specializuar për kodimin agjent. Udhëheqësi i saj i produktit, Alexander Embiricos, theksoi inteligjencën e tij adaptive, duke deklaruar,”GPT-5-kodex mund të vendosë pesë minuta në një problem që duhet të kalojë një orë tjetër.”Meta gjithashtu ka hyrë në skuadër me modelin e saj të kodit botëror, një”debugger nervor”i përqendruar në të kuptuarit e logjikës së kodit sesa thjesht ta shkruajë atë. Reagimet e hershme nga partnerët si Cursor dhe Windsurf janë pozitive. Detyrat e Horizon,”Ndërsa Drejtori i Përgjithshëm i Windsurf, Jeff Wang e quajti atë”një gjeneratë të re të modeleve të kodimit.”Për të shfaqur fuqinë e saj, Antropik gjithashtu po ofron një vrojtim të përkohshëm të hulumtimit të quajtur Imagjinoni me Claude”për pajtimtarët max .

Categories: IT Info