Anthropic telah melancarkan Claude Sonnet 4.5, model AI terbarunya, yang dikatakan syarikat itu adalah model terbaik dan paling selamat di dunia untuk pengekodan dan membina ejen perisian kompleks. Claude Sonnet 4.5 menunjukkan prestasi terkini pada penanda aras industri utama. Pelancaran ini termasuk peningkatan utama kepada alat pemaju Anthropic, seperti pelanjutan kod VS baru dan ejen SDK, yang bertujuan untuk membolehkan tugas-tugas autonomi yang lebih canggih. href=”https://www.anthropic.com/claude-sonnet-4-5-system-card”target=”_ blank”> Mengurangkan risiko dan mengurangkan tingkah laku yang berbahaya . Langkah ini meletakkannya sebagai rakan kongsi AI yang lebih dipercayai dan sejajar untuk pemaju dalam perlumbaan teknologi yang pesat meningkat.

Penanda aras baru untuk pengekodan AI dan ketahanan agentik

dakwaan ketuanan antropik disokong oleh metrik yang mengagumkan yang kedudukan sonnet 4.5 di bahagian atas beberapa papan pendahulu industri utama. pengumuman rasmi menyoroti prestasi state-of-the-art yang menuntut Model

Prestasi ini meletakkannya di hadapan pesaing seperti Google’s Gemini 2.5 Pro dan GPT-5 OpenAI di beberapa bidang, menurut tanda aras yang dikongsi oleh syarikat itu.

Lompat prestasi ini bukan hanya tambahan; Ia melampaui model perdana antropik yang lebih mahal, Opus 4.1. Dengan menyampaikan keupayaan unggul pada titik harga yang sama seperti sonnet 4 yang lebih tua, antropik membuat kes yang kuat untuk kecekapan dan nilai, yang menawarkan pemaju akses kepada prestasi teratas tanpa premium kos.

Laporan antropik bahawa Sonnet 4.5 boleh beroperasi pada projek-projek yang kompleks dan pelbagai langkah selama lebih dari 30 jam secara berterusan. Semasa ujian awal, penyelidik AI antropik David Hershey memberitahu TechCrunch dia menyaksikan model itu bukan sahaja membina permohonan tetapi juga menunaikan perkhidmatan pangkalan data, membeli nama domain, dan melakukan audit keselamatan SOC 2. keluasan yang lebih besar. Maklum balas awal daripada pakar dalam kewangan, undang-undang, perubatan, dan STEM mendapati bahawa Sonnet 4.5 mempunyai pengetahuan dan pemikiran khusus domain yang lebih baik daripada model-model yang terdahulu. Seperti yang dinyatakan oleh Hershey, sukar untuk menangkap prestasi Claude Sonnet 4.5 pada tanda aras sahaja, yang menonjolkan keupayaan model untuk menangani cabaran-cabaran yang panjang, horizon yang lebih lama daripada yang diperkuatkan oleh seorang pemaju yang lebih tinggi. pengembangan ekosistem pemaju antropik. Syarikat ini mempunyai melancarkan alat baru yang kuat Claude Code, ejen pengekodan popular syarikat. Ia kini termasuk”pusat pemeriksaan,”ciri yang sangat diminta yang secara automatik menjimatkan keadaan kod sebelum setiap perubahan.

href=”https://marketplace.visualstudio.com/items?itemname=anthropic.claude-code”target=”_ blank”> Extension vs code ovation , kini dalam beta. Ini membawa keupayaan Kod Claude terus ke dalam IDE, menawarkan antara muka yang lebih kaya dan grafik dengan sidebar khusus dan masa nyata diffs. href=”https://www.anthropic.com/news/context-management”target=”_ blank”> Alat pengurusan konteks lanjutan .

Pendekatan dua arah ini mempunyai kesan yang boleh diukur. Ujian dalaman menunjukkan bahawa menggabungkan alat-alat ini meningkatkan prestasi ejen pada tugas kompleks sebanyak 39% dan mengurangkan penggunaan token sebanyak 84% dalam penilaian carian web 100-giliran, yang membolehkan ejen menyelesaikan aliran kerja yang akan gagal. href=”https://anthropic.com/engineering/building-agents-with-the-claude-agent-sdk”target=”_ blank”> Melepaskan claude ejen sdk . Ini bukan sekadar perpustakaan; Ia memberikan pemaju akses kepada infrastruktur teras yang sama yang menguasai kod Claude. Ia membolehkan penciptaan ejen tersuai untuk aliran kerja khusus, dari pematuhan kewangan kepada keselamatan siber.

Strategi ini secara langsung menyokong visi jangka panjang syarikat. Sebagai Ketua Pegawai Eksekutif Dario Amodei sebelum ini menyatakan,”Kami menuju ke dunia di mana pemaju manusia dapat menguruskan armada ejen, tetapi saya fikir penglibatan manusia yang berterusan akan menjadi penting untuk kawalan kualiti…”SDK baru adalah langkah asas untuk membuat visi itu menjadi realiti bagi semua pemaju. Sonnet 4.5 sebagai”model sempadan yang paling sejajar lagi”. Kad sistem rasmi syarikat itu memperincikan latihan keselamatan yang luas yang telah membawa kepada pengurangan yang besar dalam tingkah laku yang tidak diingini seperti sycophancy, penipuan, dan mencari kuasa.

Ini termasuk penyebaran penapis yang direka untuk mengesan dan mencegah penjanaan output yang berpotensi berbahaya, terutamanya yang berkaitan dengan senjata kimia, biologi, radiologi, dan nuklear (CBRN). Syarikat itu mendakwa Sonnet 4.5 adalah kurang cenderung kepada serangan suntikan yang cepat dan kelemahan lain yang telah melanda generasi sebelumnya model AI.

Ia adalah langkah strategik dalam pasaran yang kompetitif. Hanya beberapa minggu yang lalu, OpenAI melancarkan GPT-5-CODEX, model khusus untuk pengekodan agentik. Pemimpin produknya, Alexander Embiricos, menonjolkan kecerdasan penyesuaiannya, menyatakan,”GPT-5-CODEX boleh memutuskan lima minit ke dalam masalah yang diperlukan untuk menghabiskan satu jam lagi.”META juga telah memasuki pergaduhan dengan model dunia kodnya,”debugger saraf”memberi tumpuan kepada pemahaman logik kod dan bukan hanya menulisnya.

Strategi Anthropic nampaknya dua kali: bersaing dengan prestasi mentah sambil membezakan pengalaman keselamatan dan pemaju. Maklum balas awal dari rakan kongsi seperti kursor dan windsurf adalah positif. Dengan penambahbaikan yang ketara pada tugas-tugas cakrawala yang lebih panjang,”sementara CEO Windsurf Jeff Wang menyebutnya sebagai”generasi baru model pengekodan.”

Bagi pemaju, harga tetap tidak berubah dari Claude Sonnet 4, pada $ 3 per juta input input dan $ 15 per juta output output, menjadikan kebolehbasahan baru. Untuk mempamerkan kuasa, Anthropic juga menawarkan pratonton penyelidikan sementara yang dipanggil ‘Bayangkan dengan Claude’untuk pelanggan Max .

Categories: IT Info