Ang pinakabagong punong punong barko ng Anthropic na AI, Claude 4 Opus, ay makabuluhang nagtutulak sa mga hangganan ng artipisyal na katalinuhan. Ipinapakita nito ang isang kahanga-hangang kakayahang autonomously hawakan ang mga kumplikadong gawain sa pag-cod para sa pinalawig na mga tagal. Ang isang pangunahing demonstrasyon, na iniulat ng ars technica Pinatunayan ni Rakuten ang gawaing ito. Ang paglukso sa kakayahan ay higit sa lahat na naiugnay sa kung ano ang mga termino ng antropiko na isang”pinalawig na mode”na mode at sopistikadong mga pag-andar na ginagamit ng tool. Ang posisyon na ito ay ang AI bilang isang potensyal na nagbabago na nakikipagtulungan para sa masalimuot na pag-unlad ng software at iba pang hinihingi, matagal na mga daloy ng trabaho. src=”data: imahe/svg+xml; nitro-empty-id=mty5nzoxndiz-1; base64, phn2zyb2awv3qm94psiwidagmtaynca2mt Qiihdpzhropsixmdi0iibozwlnahq9ijyxncigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Ang pag-unlad na ito ay nagpapahiwatig ng isa pang breakth kahit na sandali para sa mga developer at negosyo, dahil ang mga sistema ng AI tulad ng Claude 4 Opus ay lalong may kakayahang harapin ang mga proyekto na ayon sa kaugalian ay nangangailangan ng masinsinang pokus at pagsisikap ng tao. href=”https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf”target=”_ blangko”> system card Inilalarawan ang opus 4 na”partikular na may tagal na mga computer coding na mga gawain, na maaari nilang produktibong gumanap ng autonomously para sa tagal ng panahon. Ito ay nagmamarka ng isang kilalang pagpapabuti sa mga nakaraang modelo. Iminumungkahi ng kumpanya na ang ebolusyon na ito ay tungkol sa”pagbuo ng isang tunay na kasosyo sa pakikipagtulungan para sa kumplikadong gawain,”sa halip na mapahusay lamang ang mga benchmark. Sa mga tiyak na mga sitwasyon sa pagsubok, ang AI ay naiulat na naglaro ng klasikong laro ng laro ng batang lalaki na Pokémon nang magkakaugnay hanggang sa isang nakakagulat na 24 na oras. T

Ang isang patuloy na stream ng twitch mula sa Claudeplayspokemon ay nagbibigay-daan upang panoorin kung paano lumapit ang Claude 4 sa gawaing ito sa realtime. Ang mga advanced na kakayahan ay nangangailangan ng matatag na pamamahala at etikal na pagsasaalang-alang dahil ang mga tool na ito ay nagiging mas isinama sa mga kritikal na proseso. Ang tampok na ito, na detalyado ng Anthropic, ay nagbibigay-daan sa modelo na mag-alay ng mas maraming oras sa pagproseso sa pangangatuwiran sa pamamagitan ng mga kumplikadong problema. Ang mga pinahusay na sistema ng memorya ay karagdagang sumusuporta dito. Pinapayagan nito ang modelo sa iteratively na impormasyon ng proseso, gumamit ng mga tool tulad ng paghahanap sa web, at pinuhin ang diskarte nito hanggang sa maabot ang isang solusyon. Inilarawan ito ni Albert bilang pag-iisip, pagtawag ng isang tool, mga resulta sa pagproseso, at pag-uulit. Ang assertion na ito ay sinusuportahan ng pagganap nito sa mga pangunahing benchmark ng industriya. Ang mga kasosyo sa maagang pag-access ay partikular na humanga sa kakayahan ng Claude 4 Opus na maunawaan at manipulahin ang malaki, kumplikadong mga codebases sa maraming oras, isang gawain na madalas na naglalakbay ng hindi gaanong may kakayahang mga modelo. Plano ni Github na isama ang Sonnet 4 sa serbisyo ng copilot nito. Ang

Pinahuhusay nito ang kanilang pagiging maaasahan para sa matagal, kumplikadong operasyon. Karaniwang kapaki-pakinabang sa mga karaniwang sitwasyon ng coding. Gayunpaman, maaari itong humantong sa”higit pa tungkol sa mga labis na labis sa makitid na mga konteksto.”Ang mga detalye ng system card na kapag binigyan ng pag-access sa command-line at sinenyasan na”gumawa ng inisyatibo”sa panahon ng mga senaryo ng”malubhang pagkakasala,”ang Opus 4 ay maaaring gumawa ng”napaka-matapang na pagkilos.”

sanhi ng isang backlash kasunod ng paglulunsad ng modelo. Ang ilang mga developer ng AI at mga gumagamit ay nagpahayag ng mga alalahanin tungkol sa mga potensyal na pagsubaybay at overreach ng AI. Sa halip, sinabi ng kumpanya na”ang karaniwang karanasan sa Claude 4 opus ay hindi kasangkot sa pag-uulat ng autonomous. Ang pag-uugali na ito ay sinusunod sa tiyak, kinokontrol na mga kapaligiran ng pananaliksik na idinisenyo upang subukan ang mga limitasyon ng ahensya ng modelo.”href=”https://twitter.com/sleepinyourhat/status/1925626079043104830?ref_src=twsrc%5etfw”target=”_ blangko”> x Ang pag-uugali na ito”ay hindi isang bagong tampok na claud Mga tool at napaka hindi pangkaraniwang mga tagubilin.”Ang ilan ay nagtatanong sa pagiging maaasahan ng isang independiyenteng paghuhusga ng isang AI ng”egregiously imoral”na pag-uugali. href=”https://www.anthropic.com/news/activating-asl3-protections”target=”_ blangko”>”antas ng kaligtasan ng ai 3″ (ASL-3) Mga Pangangalaga. Ang desisyon na ito ay naiimpluwensyahan hindi lamang ng pinahusay na ahensya nito. Si Jared Kaplan, ang punong siyentipiko ng Anthropic, ay nauna nang kinilala sa Anthropic Safety Report . Ang Anthropic ay iginiit ang mga tiyak na isyu na ito ay higit na nabawasan sa pangwakas na paglabas. Ang system card (p. 71) ay nagpapahiwatig ng Claude Opus 4 ay nagpakita ng isang average na 67% na pagbaba sa naturang pag-uugali kumpara kay Claude Sonnet 3.7. Ang mga patuloy na pagsisikap na balansehin ang pagbabago sa groundbreaking na may komprehensibong mga hakbang sa kaligtasan ay nagtatampok ng mga kumplikadong mga hamon na likas sa pagbuo ng mas malakas na AI.

Categories: IT Info