Ang

Anthropic ay naglunsad ng Claude Sonnet 4.5, ang pinakabagong modelo ng AI, na inaangkin ng kumpanya ay ang pinakamahusay at pinakaligtas na modelo para sa coding at pagbuo ng mga kumplikadong ahente ng software. Ang Claude Sonnet 4.5 ay nagpapakita ng pagganap ng state-of-the-art sa mga pangunahing benchmark ng industriya. Kasama sa paglulunsad ang mga pangunahing pag-upgrade sa mga tool ng developer ng Anthropic, tulad ng isang bagong extension ng code ng VS at isang ahente ng SDK, na naglalayong paganahin ang mas sopistikadong, matagal na awtonomikong mga gawain. href=”https://www.anthropic.com/claude-sonnet-4-5-system-card”target=”_ blangko”> pag-iwas sa mga panganib at bawasan ang mga nakakapinsalang pag-uugali . Ang paglipat na ito ay nagpoposisyon nito bilang isang mas maaasahan at nakahanay na kasosyo sa AI para sa mga developer sa isang mabilis na pagtaas ng lahi ng teknolohikal. src=”data: imahe/svg+xml; nitro-empty-id=mty0mzoxnzy4-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mj Aiihdpzhropsixmjgwiibozwlnahq9ijCyMcigeg1Sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Isang bagong benchmark para sa AI Coding at Agentic Endurance

href=”https://www.anthropic.com/news/claude-sonnet-4-5″target=”_ blangko”> opisyal na anunsyo Itinampok ang state-of-the-art na pagganap sa hinihingi na mga pagsusuri tulad ng swe-bench na napatunayan, isang benchmark na sumusukat sa isang kakayahan ng AI upang malutas ang real-world software na mga isyu sa engineering mula sa Github Reposit.

Ang pagganap na ito ay inilalagay ito nangunguna sa mga kakumpitensya tulad ng Google Gemini 2.5 Pro at GPT-5 ng OpenAi sa maraming mga harapan, ayon sa mga benchmark na ibinahagi ng kumpanya. Kapansin-pansin na higit sa sariling mas mamahaling modelo ng punong barko ang Anthropic, Opus 4.1. Sa pamamagitan ng paghahatid ng higit na mahusay na mga kakayahan sa parehong punto ng presyo tulad ng mas matandang Sonnet 4, ang Anthropic ay gumagawa ng isang malakas na kaso para sa kahusayan at halaga, na nag-aalok ng mga developer ng pag-access sa top-tier na pagganap nang walang isang premium na gastos. Iniulat ng Anthropic na ang Sonnet 4.5 ay maaaring gumana sa kumplikado, maraming hakbang na mga proyekto nang higit sa 30 oras na patuloy. Sa mga unang pagsubok, sinabi ng antropiko na mananaliksik ng AI na si David Hershey sa TechCrunch na napanood niya ang modelo na hindi lamang bumuo ng isang aplikasyon ngunit tumayo din sa mga serbisyo sa database, pagbili ng mga pangalan ng domain, at nagsasagawa ng isang soc 2 security audit sa sarili nitong gawain. Nagpapakita din ng higit na lapad. Ang maagang puna mula sa mga eksperto sa pananalapi, batas, gamot, at STEM ay natagpuan na ang Sonnet 4.5 ay kapansin-pansing mas mahusay na kaalaman na tiyak na domain at pangangatuwiran kaysa sa mga nakaraang modelo. Tulad ng nabanggit ni Hershey, mahirap makuha ang pagganap ni Claude Sonnet 4.5 sa mga benchmark na nag-iisa, na binibigyang-diin ang mga hamon na lampas sa simpleng henerasyon ng code. pagpapalawak ng ecosystem ng developer ng antropiko. Ang kumpanya ay may pinagsama ang isang suite ng malakas na mga bagong tool at mga tampok na idinisenyo upang gawing mas matatag at autonomous ang mga pangunahing punto ng pag-unlad, Claude Code, ang tanyag na ahente ng coding ng kumpanya. Kasama dito ngayon ang”mga checkpoints,”isang mataas na hiniling na tampok na awtomatikong nai-save ang estado ng code bago ang bawat pagbabago. href=”https://marketplace.visualstudio.com/items?itemname=anthropic.claude-code”target=”_ blangko”> Extension ng Code ng Katutubong VS , kasalukuyang nasa beta. Nagdadala ito ng mga kakayahan ng Claude Code nang direkta sa IDE, na nag-aalok ng isang mas mayamang, graphical interface na may isang nakalaang sidebar at real-time na inline na naiiba. href=”https://www.anthropic.com/news/context-management”target=”_ blangko”> awtomatikong tinatanggal ang mga tool sa pamamahala ng konteksto .

Ang diskarte na may dalawang pronged na ito ay may masusukat na epekto. Ang mga panloob na pagsubok ay nagpakita na ang pagsasama-sama ng mga tool na ito ay pinabuting pagganap ng ahente sa mga kumplikadong gawain sa pamamagitan ng 39% at nabawasan ang pagkonsumo ng token sa pamamagitan ng 84% sa isang 100-turn na pagsusuri sa paghahanap sa web, na nagpapahintulot sa mga ahente na makumpleto ang mga daloy ng trabaho na kung hindi man ay mabibigo. href=”https://anthropic.com/engineering/building-agents-with-the-claude-agent-sdk”target=”_ blangko”> Paglabas ng Claude Agent SDK . Ito ay hindi lamang isang silid-aklatan; Nagbibigay ito ng pag-access sa mga developer sa parehong pangunahing imprastraktura na nagbibigay lakas sa Claude Code. Pinapayagan nito ang paglikha ng mga pasadyang ahente para sa dalubhasang mga daloy ng trabaho, mula sa pagsunod sa pananalapi hanggang sa cybersecurity.

Ang diskarte na ito ay direktang sumusuporta sa pangmatagalang pananaw ng kumpanya. Tulad ng sinabi ng CEO na si Dario Amodei,”Pupunta kami sa isang mundo kung saan ang isang developer ng tao ay maaaring pamahalaan ang isang armada ng mga ahente, ngunit sa palagay ko ang patuloy na pagkakasangkot ng tao ay magiging mahalaga para sa kalidad ng kontrol…”Ang bagong SDK ay isang batayang hakbang patungo sa paggawa ng isang pangitain na katotohanan para sa lahat ng mga developer. 4.5 bilang”pinaka nakahanay na modelo ng hangganan pa”. Ang opisyal na sistema ng system ng kumpanya ay detalyado ang malawak na pagsasanay sa kaligtasan na humantong sa malaking pagbawas sa mga hindi kanais-nais na pag-uugali tulad ng sycophancy, panlilinlang, at naghahanap ng kapangyarihan. Kasama dito ang pag-deploy ng mga filter na idinisenyo upang makita at maiwasan ang henerasyon ng mga potensyal na mapanganib na mga output, lalo na ang mga nauugnay sa sandata ng kemikal, biological, radiological, at nuklear (CBRN). Inaangkin ng kumpanya na ang Sonnet 4.5 ay makabuluhang hindi gaanong madaling kapitan ng pag-iwas sa mga pag-atake ng iniksyon at iba pang mga kahinaan na naganap ang mga nakaraang henerasyon ng mga modelo ng AI. Ito ay isang madiskarteng paglipat sa isang merkado ng hyper-competitive. Ilang linggo na ang nakalilipas, inilunsad ni OpenAi ang GPT-5-Codex, isang dalubhasang modelo para sa ahente ng coding. Ang lead ng produkto nito, si Alexander Embiricos, ay naka-highlight ng adaptive intelligence, na nagsasabi,”Ang GPT-5-Codex ay maaaring magpasya ng limang minuto sa isang problema na kailangan nitong gumastos ng isa pang oras.”Nagpasok din si Meta sa Fray kasama ang Code World Model, isang”neural debugger”na nakatuon sa pag-unawa sa lohika ng code sa halip na isulat lamang ito. Ang maagang puna mula sa mga kasosyo tulad ng Cursor at Windsurf ay positibo. mas mahaba ang mga gawain sa abot-tanaw,”habang tinawag ito ng CEO ng Windsurf na si Jeff Wang na”isang bagong henerasyon ng mga modelo ng coding.”Upang maipakita ang kapangyarihan nito, ang Anthropic ay nag-aalok din ng isang pansamantalang preview ng pananaliksik na tinatawag na ‘isipin mo si Claude’para sa mga tagasuskribi ng MAX .

Categories: IT Info