Antropic a lansat Claude Sonet 4.5, cel mai recent model AI, despre care compania susține că este cel mai bun și cel mai sigur model din lume pentru codificarea și construirea de agenți software complexi. Claude Sonnet 4.5 demonstrează performanțe de ultimă generație pe reperele cheie ale industriei.

Modelul depășește predecesorii și rivalii săi precum GPT-5 al lui OpenAI și Gemini Google. Lansarea include upgrade-uri majore la instrumentele de dezvoltare ale Anthropic, cum ar fi o nouă extensie de cod vs și un agent SDK, care vizează să permită sarcini autonomă mai sofisticate, de lungă durată. href=”https://www.antropic.com/claude-sonnet-4-5-system-card”target=”_ blank”> atenuează riscurile și reduce comportamentele nocive . Această mișcare o poziționează ca un partener AI mai fiabil și mai aliniat pentru dezvoltatorii într-o cursă tehnologică cu escaladare rapidă.

Un nou punct de referință pentru codificarea AI și rezistența agentică

Afirmațiile de supremație ale Anthropic sunt susținute de o ardezie de valori impresionante pe care poziția sonet 4.5 în partea de sus a mai multor clasamente cheie ale industriei. href=”https://www.antropic.com/news/claude-sonnet-4-5″target=”_ blank”> Anunțul oficial evidențiază performanța sa de ultimă generație la evaluări solicitante, cum ar fi Swe-Bench, un punct de referință care măsoară capacitatea AI de a rezolva problemele de inginerie software reală de la Github Repositories.

Modelul a stabilit, de asemenea, o nouă înregistrare pe OSWorld, o suită care testează capacitatea AI de a îndeplini sarcini de calculator practice, din lumea reală.

a obținut un scor de 61,4 la sută, un salt semnificativ de la 42,2 la sută deținute de predecesorul său, Sonnet 4, cu doar patru luni înainte. Această performanță o plasează în fața concurenților precum Google Gemini 2.5 Pro și GPT-5 de la OpenAI pe mai multe fronturi, conform reperelor partajate de companie.

Acest salt de performanță nu este doar incremental; În special, depășește propriul model flagship mai scump al Anthropic, Opus 4.1. Prin furnizarea de capacități superioare la același punct de preț cu sonetul 4 mai vechi, Antropic face un caz puternic pentru eficiență și valoare, oferind dezvoltatorilor acces la performanțe de nivel superior fără o primă de cost.

dincolo de scorurile brute, un diferențiator cheie este rezistența mult îmbunătățită a modelului pentru munca autonomă. Rapoarte antropic că Sonnet 4.5 poate funcționa pe proiecte complexe, cu mai multe etape, timp de peste 30 de ore în mod continuu.

Acesta este un salt monumental din capacitatea de aproximativ șapte ore a Claudei 4 Opus, care a fost deja considerată o descoperire atunci când a fost lansată în mai.

aceasta nu este doar o limită teoretică. În timpul încercărilor timpurii, cercetătorul antropic AI, David Hershey, a declarat pentru TechCrunch că a urmărit modelul nu numai că a construit o aplicație, ci și să susțină serviciile de baze de date, să cumpere nume de domeniu și să efectueze un audit de securitate SOC 2 pe propria sa lucrare.

sonet 4.5 demonstrează un nou nivel de agenție practică, cu horizon lung, care se deplasează dincolo de sarcinile de codificare izolată, de asemenea lățime. Feedback-ul timpuriu de la experți în finanțe, drept, medicină și STEM a constatat că sonet 4.5 are cunoștințe și raționamente specifice domeniului din punct de vedere dramatic mai bine decât modelele anterioare.

Acest lucru este susținut în continuare de performanțele sale puternice pe o gamă largă de evaluări care măsoară abilitățile matematice și de raționament. După cum a menționat Hershey, este greu să surprindem performanța lui Claude Sonet 4.5 doar pe repere, subliniind capacitatea modelului de a aborda provocări din lumea reală, de lungă durată, care depășesc o generație simplă de cod.

Abilitarea dezvoltatorilor cu un set de instrumente modernizate

mai mult decât o simplă model de modele în care se află un model modern Ecosistemul dezvoltatorului Anthropic. Compania are a lansat o suită de instrumente noi puternice și caracteristici concepute pentru a face clădirea cu Claude mai robustă și autonomă, care se referă direct la CLUDE CODE. Agentul popular de codificare al companiei. Acesta include acum „puncte de control”, o caracteristică extrem de solicitată, care salvează automat starea de cod înainte de fiecare schimbare.

Acest lucru permite dezvoltatorilor să se retragă instantaneu la o versiune anterioară, încurajând o muncă mai ambițioasă și exploratorie, fără teama erorilor nerecuperabile. href=”https://marketplace.visualstudio.com/items?itenume=antropic.claude-code”target=”_ blank”> native vs code extensie , în prezent în beta. Acest lucru aduce capacitățile lui Claude Code direct în IDE, oferind o interfață grafică mai bogată, cu o bară laterală dedicată și dif-uri inline în timp real.

Mutarea se adresează dezvoltatorilor care preferă să lucreze în mediul grafic principal pe un terminal. href=”https://www.antropic.com/news/Context-Management”Target=”_ Blank”> Instrumente avansate de gestionare a contextului .

“Editarea contextului”șterge automat apelurile de instrumente și rezultă din conversație, în timp ce un nou”instrument de memorie”permite CLAUDE să stocheze și să recupereze informațiile critice dintr-un sistem bazat pe fișiere care persistă pe SESSIONS. Abordarea în două puncte are un impact măsurabil. Testele interne au arătat că combinarea acestor instrumente a îmbunătățit performanța agentului pe sarcini complexe cu 39% și a redus consumul de simboluri cu 84% într-o evaluare a căutării web de 100 de rânduri, permițând agenților să completeze fluxuri de lucru care altfel ar eșua.

poate cel mai semnificativ pentru utilizatorii avansați, antropic este Eliberarea agentului claude sdk . Aceasta nu este doar o bibliotecă; Oferă dezvoltatorilor acces la aceeași infrastructură de bază care alimentează codul Claude. Permite crearea de agenți personalizați pentru fluxuri de lucru specializate, de la conformitatea financiară la cibersecuritate.

Această strategie susține în mod direct viziunea pe termen lung a companiei. As CEO Dario Amodei previously stated, “we’re heading to a world where a human developer can manage a fleet of agents, but I think continued human involvement is going to be important for the quality control…”The new SDK is a foundational step toward making that vision a reality for all developers.

A Stronger Commitment to Safety and Alignment

Anthropic is heavily marketing Sonet 4.5 ca „cel mai aliniat model de frontieră încă”. Cardul oficial al companiei de card detaliază o pregătire extinsă de siguranță, care a dus la reduceri substanțiale ale comportamentelor nedorite, cum ar fi sycophancy, înșelăciune și căutare a puterii.

Modelul este lansat în cadrul strict al companiei AI Safety Level 3 (ASL-3). Aceasta include implementarea filtrelor concepute pentru a detecta și preveni generarea de rezultate potențial periculoase, în special cele legate de arme chimice, biologice, radiologice și nucleare (CBRN). Compania susține că sonetul 4.5 este semnificativ mai puțin predispus la atacuri de injecție promptă și alte vulnerabilități care au afectat generațiile anterioare de modele AI.

navigând un peisaj AI hiper-competitiv

Lansarea Sonnet 4.5 nu se întâmplă într-un vid. Este o mișcare strategică pe o piață hiper-competitivă. În urmă cu doar câteva săptămâni, OpenAI a lansat GPT-5-Codex, un model specializat pentru codificarea agentică. Conducerea produsului său, Alexander Embiricos, și-a evidențiat inteligența adaptativă, afirmând: „GPT-5-Codex poate decide cinci minute într-o problemă de care trebuie să petreacă încă o oră. De asemenea, Meta a intrat în FRAY cu modelul său de cod mondial, un „debugger neural” axat pe înțelegerea logicii codului, mai degrabă decât pe scrierea acesteia.

Strategia Antropic pare să fie dublă: concurează pe performanța brută în timp ce se diferențiază pe siguranță și experiența dezvoltatorilor. Feedback-ul timpuriu de la parteneri precum Cursor și Windsurf este pozitiv.

CEO-ul Cursor, Michael Truell, remarcat , „Vedem că de la State-of-the-Col Sarcini mai lungi de orizont, „în timp ce CEO-ul Windsurf, Jeff Wang, l-a numit„ o nouă generație de modele de codificare. Pentru a-și prezenta puterea, Anthropic oferă, de asemenea, o previzualizare a cercetării temporare numită „Imaginați-vă cu claude” pentru abonații Max .

Categories: IT Info