Anthropic hat Claude Sonnet 4.5 gestartet, sein neuestes KI-Modell, das das Unternehmen behauptet, das weltweit beste und sicherste Modell für das Codieren und Aufbau komplexer Softwareagenten sei. Claude Sonnet 4.5 zeigt eine modernste Leistung der wichtigsten Industrie-Benchmarks. Der Start umfasst wichtige Upgrades der Entwicklertools von Anthropic, wie z. href=”https://www.anthropic.com/claude-sonnet-4-5-system-card”target=”_ leer”> Risiken mildern und schädliche Verhaltensweisen reduzieren . Dieser Schritt positioniert es als zuverlässigerer und ausgerichteterer KI-Partner für Entwickler in einem schnell eskalierenden technologischen Rennen.

Ein neuer Benchmark für die KI-Codierung und die agierende Ausdauer. href=”https://www.anthropic.com/news/claude-sonnet-4-5″target=”_ leer”> offizielle Ankündigung hebt die hochmoderne Leistung auf, die auf verlangende Bewertungen wie SWE-Bench verifiziert wurden, ein Benchmark, das die Fähigkeit von AI-Messungen von AI misst.

Das Modell stellte auch einen neuen Datensatz auf Osworld fest, eine Suite, die die Fähigkeit einer KI testet, praktische, reale Computeraufgaben auszuführen. Diese Aufführung stellt es den Wettbewerbern wie Googles Gemini 2.5 Pro und OpenAIs GPT-5 an mehreren Fronten vor, so die von dem Unternehmen geteilten Benchmarks.

Dieser Leistungssprung ist nicht nur inkrementell. Es übertrifft insbesondere das teurere Flaggschiff-Modell von Anthropic, Opus 4.1. Durch die Bereitstellung überlegener Funktionen zum gleichen Preis wie das ältere Sonett 4 ist Anthropic für Effizienz und Wert starker Fall und bietet Entwicklern den Zugang zu erstklassiger Leistung ohne Kostenprämie. Anthropische Berichte, dass Sonnet 4.5 über 30 Stunden lang bei komplexen, mehrstufigen Projekten arbeiten kann. In frühen Prüfungen sagte der anthropische KI-Forscher David Hershey gegenüber TechCrunch, dass er das Modell nicht nur eine Anwendung erstellte, sondern auch Datenbankdienste erstellte, Domain-Namen kaufte und ein Soc 2-Sicherheitsaudit für seine eigene Arbeit durchführte. Breite. Früher Feedback von Experten für Finanzen, Recht, Medizin und STEM stellte fest, dass Sonett 4.5 ein dramatisch besseres domänenspezifisches Wissen und Argumentation als frühere Modelle hat. Wie Hershey bemerkte, ist es schwierig, die Leistung von Claude Sonnet 4.5 auf Benchmarks zu erfassen und die Fähigkeit des Modells zu unterstreichen, die Herausforderungen der realen Welt zu bewältigen, die über die einfache Codegenerierung hinausgehen. Der Entwickler-Ökosystem von Anthropic. Das Unternehmen hat rollte eine Reihe leistungsstarker neuer Tools aus. der beliebte Codierungsvertreter des Unternehmens. Es enthält nun”Checkpoints”, eine hoch angeforderte Funktion, die den Codezustand vor jeder Änderung automatisch speichert. href=”https://marketplace.visualstudio.com/items?itemname=anthropic.claude-code”target=”_ leer”> native vs Code-Erweiterung , derzeit in Beta. Dies bringt die Funktionen von Claude Code direkt in die IDE und bietet eine reichhaltigere grafische Schnittstelle mit einer dedizierten Seitenleiste und Echtzeit-Inline-Diffs. href=”https://www.anthropic.com/news/context-management”target=”_ leer”> Advanced Context Management Tools .

Dieser zweigleisige Ansatz hat einen messbaren Einfluss. Interne Tests zeigten, dass die Kombination dieser Tools die Agentenleistung bei komplexen Aufgaben um 39% verbesserte und den Token-Verbrauch bei einer Web-Search-Bewertung von 100% um 84% reduzierte, sodass Agenten die Vervollständigung von Workflows, die ansonsten fehlschlagen würden. href=”https://anthropic.com/engineering/building-agents-the-claude-agent-sdk”target=”_ leer”> den Claude-Agenten SDK veröffentlichen. Dies ist nicht nur eine Bibliothek; Es gibt Entwicklern Zugriff auf dieselbe Kerninfrastruktur, die den Claude-Code versorgt. Es ermöglicht die Schaffung von benutzerdefinierten Agenten für spezielle Workflows, von der finanziellen Einhaltung der Cybersicherheit.

Diese Strategie unterstützt direkt die langfristige Vision des Unternehmens. Wie CEO Dario Amodei zuvor sagte:”Wir gehen in eine Welt, in der ein menschlicher Entwickler eine Flotte von Agenten leiten kann, aber ich denke, dass die fortgesetzte menschliche Beteiligung für die Qualitätskontrolle wichtig sein wird.”Der neue SDK ist ein grundlegender Schritt, um diese Vision für alle Entwickler zu Wirklichkeit zu machen. 4.5 als „bisher am meisten ausgerichteter Grenzmodell“. Die offizielle Systemkartenkarten des Unternehmens beschreibt umfangreiche Sicherheitstrainings, die zu erheblichen Verringerungen unerwünschter Verhaltensweisen wie Sykophanz, Täuschung und Power-Suchking geführt haben. Dies beinhaltet den Einsatz von Filtern, mit denen die Erzeugung potenziell gefährlicher Ergebnisse erfasst und verhindern soll, insbesondere diejenigen, die sich auf chemische, biologische, radiologische und nukleare (CBRN)-Waffen beziehen. Das Unternehmen behauptet, Sonnet 4.5 sei wesentlich weniger anfällig für prompte Injektionsangriffe und andere Schwachstellen, die frühere Generationen von AI-Modellen geplagt haben. Es ist ein strategischer Schritt in einem wettbewerbswidrigen Markt. Vor wenigen Wochen hat OpenAI GPT-5-CODEX gestartet, ein spezielles Modell für die Agentencodierung. Sein Produktleiter, Alexander Embiricos, hob seine adaptive Intelligenz hervor und erklärte: „GPT-5-CODEX kann fünf Minuten zu einem Problem entscheiden, dass es eine weitere Stunde verbringen muss.”Meta hat auch mit seinem Code-Weltmodell, einem „neuronalen Debugger“, das sich darauf konzentriert, die Codelogik zu verstehen, anstatt es nur zu schreiben. Früher Rückmeldung von Partnern wie Cursor und Windsurf ist positiv. Horizon-Aufgaben”, während der CEO von Windsurf, Jeff Wang, als”neue Generation von Codierungsmodellen”nannte.

Für Entwickler bleibt die Preisgestaltung von Claude Sonnet 4 unverändert, bei 3 USD pro Million Eingangs-Token und 15 USD pro Million Ausgabe-Token, was die neuen Fähigkeiten zu einem direkten Aufbau machte. Um seine Macht zu demonstrieren, bietet Anthropic auch eine temporäre Forschungsvorschau namens “Stellen Sie sich mit Claude”für Max-Abonnenten .

vor

Categories: IT Info