Anthropic heeft Claude Sonnet 4.5 gelanceerd, het nieuwste AI-model, dat volgens het bedrijf’s werelds beste en veiligste model is voor het coderen en bouwen van complexe software-agenten. Claude Sonnet 4.5 demonstreert state-of-the-art prestaties op belangrijke industriële benchmarks.

Het model presteert beter dan zijn voorgangers en rivalen zoals Openai’s GPT-5 en Google’s Gemini. De lancering omvat belangrijke upgrades naar de ontwikkelaarstools van Anthropic, zoals een nieuwe VS-code-extensie en een agent SDK, gericht op het mogelijk maken van meer geavanceerde, langdurige autonome taken. href=”https://www.antropic.com/claude-sonnet-4-5-system-card”target=”_ blank”> Beperk risico’s en verminder schadelijk gedrag . Deze beweging positioneert het als een meer betrouwbare en uitgelijnde AI-partner voor ontwikkelaars in een snel escalerend technologisch ras.

Anthropic’s claims van suprematie worden ondersteund door een lei van indrukwekkende metrieken die Sonnet 4.5 bovenaan verschillende belangrijke industriële leaderboards positioneren.

het bedrijf

Het model heeft ook een nieuw record op OSWorld, een suite van een suite-capaciteit van een suite van een suite van een suite van een suite van een suite van een suite van een suite van een real-World Computer Tasks. behaalde een score van 61,4 procent, een belangrijke sprong van de 42,2 procent in handen van zijn voorganger, Sonnet 4, slechts vier maanden eerder. Deze prestatie plaatst het voorafgaand aan concurrenten zoals Google’s Gemini 2.5 Pro en Openai’s GPT-5 op meerdere fronten, volgens benchmarks die door het bedrijf worden gedeeld.

Deze prestatiesprong is niet alleen incrementeel; Het overtreft met name het eigen duurdere vlaggenschipmodel van Anthropic, Opus 4.1. Door superieure mogelijkheden te leveren tegen dezelfde prijs als de oudere sonnet 4, maakt Anthropic een sterk argument voor efficiëntie en waarde, en biedt ontwikkelaars toegang tot topprestaties zonder een kostenpremium.

Beyond Raw Scores is een belangrijke differentiator een belangrijke differentiator. Anthropic meldt dat Sonnet 4.5 meer dan 30 uur continu op complexe, multi-step-projecten kan werken.

Dit is een monumentale sprong van de ongeveer zeven uur durende capaciteit van Claude 4 Opus, die al werd beschouwd als een doorbraak toen het in mei werd gelanceerd.

Dit is niet alleen een theoretische limiet. Tijdens vroege proeven vertelde antropische AI-onderzoeker David Hershey TechCrunch dat hij het model niet alleen zag bouwen, maar ook databaseservices opstaan, domeinnamen kopen en een SOC 2-beveiligingsaudit uitvoeren op zijn eigen werk.

sonnet 4.5 toont een nieuw niveau van praktisch, lang-Horizon Agency dat verder gaat dan het codeer van het codeer. grotere breedte. Vroege feedback van experts in Finance, Law, Medicine en STEM ontdekten dat Sonnet 4.5 een dramatisch betere domeinspecifieke kennis en redenering dramatisch heeft dan eerdere modellen.

Dit wordt verder ondersteund door de sterke prestaties op een breed scala aan evaluaties die wiskundige en redenering vaardigheden. As Hershey noted, it is hard to capture Claude Sonnet 4.5’s performance on benchmarks alone, highlighting the model’s ability to tackle real-world, long-horizon challenges that go beyond simple code generation.

Empowering Developers with an Upgraded Toolkit

More than just a model upgrade, the Sonnet 4.5 launch is a significant expansion of Anthropic’s ontwikkelaar ecosysteem. Het bedrijf heeft native vs code extensie , momenteel in bèta. Dit brengt de mogelijkheden van Claude Code rechtstreeks in de IDE en biedt een rijkere, grafische interface met een speciale zijbalk en realtime inline diffs.

De beweging is geschikt voor ontwikkelaars die liever werken binnen hun primaire grafische omgeving boven een terminal. href=”https://www.anthropic.com/news/context-management”target=”_ blank”> Geavanceerde contextbeheerhulpmiddelen .

“contextbewerking”clears stale tool calls en resulteert van het gesprek, terwijl een nieuw”geheugenhulpmiddel”in staat is om crucessies te storten en te herhalen van een bestandssysteem. Tweedelige aanpak heeft een meetbare impact. Interne tests toonden aan dat het combineren van deze tools de prestaties van de agent bij complexe taken met 39% verbeterde en het tokenconsumptie met 84% verminderd in een 100-turn webzoekevaluatie, waardoor agenten workflows kunnen voltooien die anders zouden falen.

Misschien het meest aanzienlijk voor geavanceerde gebruikers, anthropisch is het vrijgeven van de Claude-agent SDK . Dit is niet alleen een bibliotheek; Het geeft ontwikkelaars toegang tot dezelfde kerninfrastructuur die de code van Claude aandrijft. Het maakt het maken van aangepaste agenten mogelijk voor gespecialiseerde workflows, van financiële naleving tot cybersecurity.

Deze strategie ondersteunt direct de langetermijnvisie van het bedrijf. Zoals CEO Dario Amodei eerder verklaarde:”We gaan naar een wereld waar een menselijke ontwikkelaar een vloot van agenten kan beheren, maar ik denk dat voortdurende menselijke betrokkenheid belangrijk zal zijn voor de kwaliteitscontrole…”De nieuwe SDK is een fundamentele stap in de richting van het maken van die visie een realiteit voor alle ontwikkelaars. Sonnet 4.5 als zijn”meest uitgelijnde grensmodel tot nu toe”. De officiële systeemkaart van het bedrijf details uitgebreide veiligheidstraining die heeft geleid tot substantiële verminderingen van ongewenst gedrag zoals sycofancy, misleiding en stroomzoeking.

Het model wordt vrijgegeven onder het strikte AI-veiligheidsniveau 3 (ASL-3) framework van het bedrijf. Dit omvat het implementeren van filters die zijn ontworpen om het genereren van potentieel gevaarlijke outputs, met name die gerelateerd aan chemische, biologische, radiologische en nucleaire (CBRN) wapens te detecteren en te voorkomen. Het bedrijf beweert dat Sonnet 4.5 aanzienlijk minder vatbaar is voor aanwijzingen voor injectieaanvallen en andere kwetsbaarheden die vorige generaties AI-modellen hebben geteisterd.

navigeren met een hypercompetitief AI-landschap

Het is een strategische stap in een hypercompetitieve markt. Slechts weken geleden lanceerde OpenAI GPT-5-Codex, een gespecialiseerd model voor agentische codering. De productleider, Alexander Embiricos, benadrukte zijn adaptieve intelligentie en verklaarde:”GPT-5-codex kan vijf minuten beslissen in een probleem dat het nodig heeft om nog een uur door te brengen.”

Ondertussen demonstreerde Google’s Gemini onlangs bovenmenselijke probleemoplossing bij de ICPC World Finals. Meta heeft ook de strijd ingevoerd met zijn codewereldmodel, een”neurale debugger”gericht op het begrijpen van codelogica in plaats van het alleen te schrijven.

de strategie van Anthropic lijkt tweevoudig: concurreren met ruwe prestaties terwijl het onderscheid maakt van veiligheid en ontwikkelaarservaring. Early feedback from partners like Cursor and Windsurf is positive.

Cursor’s CEO, Michael Truell, noted, “we’re seeing state-of-the-art coding performance from Claude Sonnet 4.5, with significant improvements on longer Horizon-taken,”terwijl Jeff Wang, CEO van Windsurf, het”een nieuwe generatie coderingsmodellen”noemde.

Voor ontwikkelaars blijft de prijzen ongewijzigd van Claude Sonnet 4, op $ 3 per miljoen input tokens en $ 15 per miljoen outputtokens, waardoor de nieuwe capaciteiten een direct upgrade zijn. Om zijn kracht te laten zien, biedt antropische ook een tijdelijk onderzoekspreview met de naam ‘Imagine with Claude’ voor Max-abonnees .

Categories: IT Info