Antropico ha lanciato Claude Sonnet 4.5, il suo ultimo modello AI, che la società afferma è il modello migliore e più sicuro al mondo per codificare e costruire agenti software complessi. Claude Sonnet 4.5 dimostra le prestazioni all’avanguardia sui parametri di riferimento del settore.

Il modello supera i suoi predecessori e rivali come GPT-5 di Openi e Gemini di Google. Il lancio include importanti aggiornamenti agli strumenti per gli sviluppatori di Antropic, come una nuova estensione del codice VS e un agente SDK, volto a consentire attività autonome più sofisticate e di lunga durata. href=”https://www.anthropic.com/claude-sonnet-4-5-system-card”target=”_ blank”> mitiga i rischi e riduci i comportamenti dannosi . Questa mossa lo posiziona come un partner AI più affidabile e allineato per gli sviluppatori in una razza tecnologica in rapido aumento.

Un nuovo punto di riferimento per la codifica dell’intelligenza artificiale e la resistenza agente

Le affermazioni antropiche di supremazia sono supportate da una serie di metriche impressionanti che posizionano Sonnet 4.5 in cima a diverse classifiche del settore chiave.

La società Annuncio ufficiale mette in evidenza le sue prestazioni di stato di ingegneria statale su Github.

Il modello ha anche stabilito un nuovo record su OsWorld, una suite che mette alla prova la capacità di un’intelligenza artificiale di eseguire attività di computer pratici e reali.

Ha ottenuto un punteggio del 61,4 per cento, un salto significativo dal 42,2 per cento detenuto dal suo predecessore, Sonnet 4, appena quattro mesi prima. Questa performance lo pone davanti ai concorrenti come Google Gemini 2.5 Pro e GPT-5 di Openi su più fronti, secondo i parametri di riferimento condivisi dalla società.

Questo salto di prestazioni non è solo incrementale; Supera in particolare il modello di punta più costoso di Antropico, Opus 4.1. Offrendo capacità superiori allo stesso prezzo del Sonetto 4 più vecchio, Antropic sta facendo un forte caso per l’efficienza e il valore, offrendo agli sviluppatori l’accesso alle prestazioni di alto livello senza un costo di costo. Antropico riferisce che Sonnet 4.5 può operare su progetti complessi e multi-step per oltre 30 ore continuamente.

Questo è un salto monumentale dalla capacità di circa sette ore di Claude 4 Opus, che era già considerato una svolta quando è stato lanciato a maggio.

Questo non è solo un limite teoretico. Durante le prime prove, il ricercatore antropico AI David Hershey ha detto a TechCrunch di aver visto il modello non solo costruire un’applicazione ma anche di resistere ai servizi di database, di acquistare nomi di dominio ed eseguire un audit di sicurezza SOC 2 sul proprio lavoro.

Sonnet 4.5 di un nuovo livello pratico, un nuovo livello di gestione di una maggiore entità. Larghezza. Il feedback precoce di esperti di finanza, legge, medicina e STEM ha scoperto che Sonet 4.5 ha una conoscenza e un ragionamento specifici del dominio drasticamente migliori rispetto ai modelli precedenti.

Ciò è ulteriormente supportato dalla sua forte performance su una vasta gamma di valutazioni che misurano le capacità matematiche e di ragionamento. Come ha notato Hershey, è difficile catturare le prestazioni di Claude Sonnet 4.5 solo sui parametri di riferimento, evidenziando la capacità del modello di affrontare le sfide del mondo reale, che vanno oltre la semplice generazione di codice.

Empowering a potenziamento degli sviluppatori con un utensile aggiornato L’ecosistema degli sviluppatori antropici. La società ha ha lanciato una suite di nuovi strumenti e caratteristiche progettate per rendere la costruzione con CLAUDE più robusta e autonoma, indirizzando direttamente a chiave di sviluppo. Codice, l’agente di codifica popolare dell’azienda. Ora include”checkpoint”, una funzionalità altamente richiesta che salva automaticamente lo stato del codice prima di ogni modifica.

Ciò consente agli sviluppatori di riavvolgere istantaneamente una versione precedente, incoraggiando un lavoro più ambizioso ed esplorativo senza la paura di errori irremovibili. href=”https://marketplace.visualstudio.com/items?iMemname=anthropropic.claude-code”Target=”_ blank”> estensione nativa vs codice , attualmente in beta. Ciò porta le capacità di Claude Code direttamente nell’IDE, offrendo un’interfaccia grafica più ricca con una barra laterale dedicata e differenze in linea in tempo reale.

La mossa si rivolge agli sviluppatori che preferiscono lavorare all’interno del loro ambiente grafico-Introduzione di un terminale. href=”https://www.anthropic.com/news/context-management”target=”_ blank”> strumenti avanzati di gestione del contesto .

“Modifica del contesto”elimina automaticamente le chiamate degli strumenti stantii. L’approccio a due punte ha un impatto misurabile. I test interni hanno mostrato che la combinazione di questi strumenti ha migliorato le prestazioni degli agenti su compiti complessi del 39% e il consumo ridotto di token dell’84% in una valutazione della ricerca Web a 100 torni, consentendo agli agenti di completare i flussi di lavoro che altrimenti fallirebbero. href=”https://anthropic.com/engineering/building-agents-with-the-claude-agent-sdk”target=”_ blank”> Rilascio dell’agente Claude sdk . Questa non è solo una biblioteca; Offre agli sviluppatori l’accesso alla stessa infrastruttura di base che alimenta il codice Claude. Consente la creazione di agenti personalizzati per flussi di lavoro specializzati, dalla conformità finanziaria alla sicurezza informatica.

Questa strategia supporta direttamente la visione a lungo termine dell’azienda. In precedenza, come affermava il CEO Dario Amodei,”Stiamo andando in un mondo in cui uno sviluppatore umano può gestire una flotta di agenti, ma penso che il continuo coinvolgimento umano sarà importante per il controllo di qualità…”Il nuovo SDK è un passo fondamentale per rendere quella visione una realtà. 4.5 come”Modello di frontiera più allineato ancora”. Il dettaglio della carta ufficiale della società dell’azienda che ha portato a una sostanziale riduzioni di comportamenti indesiderati come la sicofanità, l’inganno e la ricerca di energia. Ciò include la distribuzione di filtri progettati per rilevare e prevenire la generazione di risultati potenzialmente pericolosi, in particolare quelli relativi alle armi chimiche, biologiche, radiologiche e nucleari (CBRN).

Questa attenzione alla sicurezza è una risposta diretta a preoccupazioni a livello di settore e mira a costruire la fiducia con i clienti aziendali. La società afferma che Sonnet 4.5 è significativamente meno incline a rapidi attacchi di iniezione e altre vulnerabilità che hanno afflitto le generazioni precedenti di modelli di intelligenza artificiale.

navigando in un paesaggio AI iper-competitivo

Il lancio di Sonnet 4.5 non si verifica in un vuoto. È una mossa strategica in un mercato iper-competitivo. Solo settimane fa, Openai ha lanciato GPT-5-Codex, un modello specializzato per la codifica agente. Il suo protagonista del prodotto, Alexander Ambiricos, ha messo in evidenza la sua intelligenza adattiva, affermando:”GPT-5-Codex può decidere cinque minuti in un problema che deve trascorrere un’altra ora.”

Nel frattempo, i Gemini di Google hanno recentemente dimostrato la risoluzione dei problemi superumani alle finali mondiali dell’ICPC. Meta è anche entrato nella mischia con il suo modello di codice mondiale, un”debugger neurale”incentrato sulla comprensione della logica del codice piuttosto che semplicemente scriverlo.

La strategia di Antropico sembra essere duplice: competere sulle prestazioni grezze mentre si differenziano sulla sicurezza e sull’esperienza degli sviluppatori. Il feedback precoce di partner come Cursor e Windsurf è positivo.

CEO del cursore, Michael Truell, notato ,”Stiamo vedendo le prestazioni di codifica statale da ClauD Attività di Horizon,”Mentre il CEO di Windsurf, Jeff Wang, lo ha definito”una nuova generazione di modelli di codifica”.

Per gli sviluppatori, il prezzo rimane invariato da Claude Sonnet 4, a $ 3 per milione di token di input e $ 15 per milione di token di output, rendendo le nuove funzionalità un aumento diretto. Per mostrare il suo potere, Antropic offre anche un’anteprima di ricerca temporanea chiamata “immagina con claude”per gli abbonati massimi .

Categories: IT Info