Ang

antropiko ay makabuluhang pagsulong ng mga kakayahan para sa sopistikadong pag-unlad ng ahente ng AI. Inilunsad ng kumpanya ang makapangyarihang mga modelo ng Claude 4 at isang bagong toolkit ng developer noong Mayo 23. Ang unveiling na ito ay naganap sa unang kumperensya ng developer ng Anthropic. Ang madiskarteng”upstack”na paglipat na ito ay naglalayong bigyan ng kapangyarihan ang mga developer. Ang mga gumagamit at negosyo ay maaaring asahan ang mas may kakayahang mga sistema ng AI, gayon pa man ito ay nagpapatibay din sa kaligtasan at etikal na talakayan na nakapalibot sa lalong autonomous AI. Kabilang dito ang pagpapatupad ng code, isang koneksyon ng konteksto ng protocol (MCP), isang file na API, at pinalawak na prompt caching. Anthropic’s system card para sa claude 4 , nai-publish na maaaring 2025, detalyado ang mga modelo ng’high-agency na pag-uugali. Ang Anthropic’s Claude 4 Opus AI ay maaaring ideepently code sa loob ng maraming oras, gamit ang”Extended Thinking”Dahil dito, ipinatupad ng Anthropic ang mahigpit na antas ng kaligtasan ng AI 3 (ASL-3) na mga protocol. Ipinaliwanag ni Anthropic na ito ay isang pag-iingat na panukala dahil habang ang modelo ay hindi tiyak na naipasa ang threshold ng ASL-3 na mga kakayahan, ang pag-aalis ng Claude Opus 4 na may mga hakbang na ASL-3 bilang isang pag-iingat, pansamantalang pagkilos.”Ang bagong suite ng mga tool ng Anthropic ay idinisenyo upang gawing simple at mapabilis ang paglikha ng mga makapangyarihang ahente ng AI. Ang isang pangunahing alok ay isang tool sa pagpapatupad ng code, na nagpapagana ng Claude na magpatakbo ng Python code sa isang sandboxed na kapaligiran para sa mga gawain tulad ng pagsusuri ng data, ayon sa dokumentasyon . Araw-araw bago mag-apply ang bawat oras na singil. Inilarawan ni Anthropic ang mga kakayahan na ito na may isang halimbawa: isang ahente ng pamamahala ng proyekto ng AI gamit ang MCP connector na may asana, ang mga file na API para sa mga ulat, at pagpapatupad ng code para sa pagsusuri, tulad ng detalyado sa kumpanya ng blog . Claude upang makipag-ugnay sa anumang remote na MCP server, tulad ng mula sa zapier o asana , nang walang pasadyang code ng kliyente. Ang isang bagong mga file ng API Pinapadali ang pag-iimbak ng dokumento at pag-access para sa mga aplikasyon. href=”https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching#1-hour-cache-duration-beta”target=”_ blangko”> isang oras na oras-to-live , na naglalayong i-cut ang mga gastos at latency para sa mga kumplikadong ahente ng ahente. Ang kumperensya ng developer ng Anthropic ay gumuhit ng higit sa 500 na dadalo, na nag-sign ng malakas na interes. Tama ang mga bagay at makuha ang mga detalye. Ang cybersecurity, pang-agham na pananaliksik, at mga biomedical na patlang, kasama ang MCP ay posibleng kumonekta sa mga kagamitan sa real-world. Si Holger Mueller, isang analyst sa Constellation Research, inilarawan ito Ang isang mahusay na halimbawa ng paglipat na ito kasama ang pinakabagong paglabas nito,”Ang pagpapansin ay nagbibigay ng pinahusay na suporta sa MCP, mas madaling pag-upload ng file, pag-access sa library ng analytic, at isang mas mahabang window ng konteksto. Napansin pa ni Mueller na ang posisyon na ito ay antropiko sa isang”kurso ng pagbangga sa mga sinaunang handog na software,”at na ang ilang mga bagong kakumpitensya ay maaaring ironically na umiiral na mga kasosyo o mamumuhunan. talakayan. Ang mga detalye ng system card ng Anthropic na kapag binigyan ng command-line access at”kumuha ng inisyatibo”na mga senyas, ang modelo ay maaaring gumawa ng”napaka-naka-bold na pagkilos,”tulad ng pag-lock ng mga gumagamit sa labas ng mga system o mga awtoridad na may bulk. Ang umuusbong na pag-uugali na ito, hindi isang karaniwang tampok, na humantong sa pag-backlash tungkol sa awtonomiya ng AI. @Teknium1 ng Nous Research ay nagtanong,”Bakit gagamitin ng mga tao ang mga tool na ito kung ang isang karaniwang error sa LLMS ay nag-iisip ng mga recipe para sa maanghang na mayo ay mapanganib ??” Habang tinanong ni Austin Allred ng Gauntlet Ai si Anthropic,”Matapat na Tanong para sa Anthropic Team: Nawala mo ba ang iyong isip?”. Ang karanasan ng gumagamit ay hindi kasangkot sa pag-uulat ng autonomous. ai alignment researcher sam bowman din binibigyang diin sa x Na ang pag-uugali ay sinusunod lamang sa mga tiyak na pagsubok sa kapaligiran. Ang mga pangangalaga sa ASL-3 para sa Opus 4 ay bahagyang hinihimok ng mga alalahanin na maaaring makatulong sa modelo sa paglikha ng mga bioweapons; Ito ay”posible”para sa AI na tumulong sa synthesizing mapanganib na mga pathogen tulad ng”covid o isang mas mapanganib na bersyon ng trangkaso.”Sa isang follow-up na post ng blog

Mahalaga, ang system card ay nagtatala din ng makabuluhang pag-unlad sa pagbabawas ng gantimpala-hacking, na may Claude Opus 4 na nagpapakita ng isang 67% average na pagbaba sa pag-uugali ng hard-coding kumpara sa Sonnet 3.7. Sinasabi ng Anthropic na habang napansin nila ang tungkol sa pag-uugali sa Claude Opus 4 sa maraming mga sukat, dahil sa mga kadahilanan tulad ng isang kakulangan ng magkakaugnay na maling mga tendencies at isang pangkalahatang kagustuhan para sa ligtas na pag-uugali, sa pangkalahatan ay”hindi sila naniniwala na ang mga alalahanin na ito ay bumubuo ng isang pangunahing bagong panganib.”Ang pinakamahusay na modelo ng coding sa mundo, na may matagal na pagganap sa kumplikado, matagal na mga gawain at mga daloy ng ahente,”nakamit ang 72.5% na marka sa benchmark ng SWE-Bench Software. Ang modelo ay mapagkumpitensya din sa pangangatuwiran na antas ng graduate (GPQA Diamond, pagsukat ng pangangatuwiran sa mga tanong na antas ng graduate) at multilingual Q&A (mmmlu benchmark, pagtatasa ng multilingual multitask wika na pag-unawa). Ang mga modelo ay magagamit sa pamamagitan ng API ng Anthropic, Amazon Bedrock, at Vertex AI ng Google Cloud. Ang Opus 4 ay naka-presyo sa $ 15 bawat milyong mga token ng input at $ 75 bawat milyong mga token ng output, na may Sonnet 4 sa $ 3 at $ 15 ayon sa pagkakabanggit.