Anthropic secara signifikan memajukan keupayaan untuk pembangunan ejen AI yang canggih. Syarikat itu melancarkan model Claude 4 yang kuat dan toolkit pemaju baru pada 23 Mei. Pembukaan ini berlaku pada persidangan pemaju pertama Anthropic. Langkah”upstack”strategik ini bertujuan untuk memperkasakan pemaju. Pengguna dan perniagaan boleh menjangkakan lebih banyak sistem AI yang berkebolehan, namun ini juga meningkatkan perbincangan keselamatan dan etika di sekitar AI yang semakin autonomi. Ini termasuk pelaksanaan kod, penyambung protokol konteks model (MCP), API fail, dan caching cepat diperluaskan. Anthropic’s

Suite alat baru Anthropic direka untuk memudahkan dan mempercepatkan penciptaan agen AI yang kuat. Tawaran utama adalah alat pelaksanaan kod, yang membolehkan Claude menjalankan kod python dalam persekitaran kotak pasir untuk tugas-tugas seperti analisis data, menurut zapier atau asana , tanpa kod klien tersuai. A New files api Memudahkan penyimpanan dokumen dan akses untuk aplikasi. href=”https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching#1-hour-cache-duration-beta”target=”_ blank”> satu jam to-to-live postingan blog susulan , amodei mengulangi,”matlamat kami adalah untuk menyediakan alat-alat

Yang penting, kad sistem juga mencatatkan kemajuan yang signifikan dalam mengurangkan penghalang ganjaran, dengan Claude Opus 4 menunjukkan penurunan purata 67% dalam tingkah laku pengekodan keras berbanding Sonnet 3.7. Menyatakan bahawa walaupun mereka memerhatikan mengenai tingkah laku di Claude Opus 4 merentasi banyak dimensi, kerana faktor-faktor seperti kekurangan kecenderungan yang tidak jelas dan prestasi yang sama,”Model pengekodan terbaik di dunia, dengan prestasi yang berterusan pada tugas-tugas kerja yang rumit, jangka panjang dan aliran kerja ejen,”mencapai skor 72.5% pada penanda aras kejuruteraan perisian SWE-Bench. Model ini juga berdaya saing dalam penalaran peringkat siswazah (GPQA Diamond, mengukur penalaran pada soalan peringkat siswazah) dan Q & A berbilang bahasa (mmmlu penanda aras, menilai pemahaman bahasa multitask berbilang bahasa). Model ini boleh didapati melalui API Anthropic, Amazon Bedrock, dan Google Cloud’s Vertex AI. Opus 4 berharga $ 15 per juta token input dan token output $ 75 per juta, dengan Sonnet 4 pada $ 3 dan $ 15 masing-masing.

Categories: IT Info