IBM telah melancarkan model Granite 4.0 AI yang baru, menawarkan lompatan utama dalam kecekapan untuk perniagaan.
Dikeluarkan minggu ini, keluarga sumber terbuka menggunakan reka bentuk hibrid novel, mencampurkan
Model dibina untuk kegunaan perusahaan, memberi tumpuan kepada kepercayaan dan prestasi tinggi. Mereka boleh didapati sekarang di ibm’s watsonx.ai ,
Granite 4.0 menandakan langkah IBM untuk menyediakan alat AI yang kuat namun berpatutan untuk pasaran global, meletakkannya sebagai pesaing utama. Contender. beregu. Ini menjadikan mereka mahal untuk dijalankan.
Model baru IBM menghalang isu ini dengan menggabungkan dua arsitektur yang berbeza. Mereka
href=”https://www.aiml.com/ibm-launches-granite-4-0-hybrid-ai-models-with-lower-mory-and-hardware-costs/”sasaran=”_ blank”Penyelidik sedang meneroka pelbagai kaedah, dari cascade spekulatif Google kepada teknik mampatan tanpa kehilangan seperti DFLOAT11, semuanya bertujuan untuk menjadikan model besar lebih mudah dan mampan. Inovasi seni bina IBM adalah entri utama dalam bidang ini. Syarikat itu mendakwa seni bina baru boleh mengurangkan keperluan memori GPU sebanyak 70% semasa kesimpulan, terutamanya untuk beban kerja dengan konteks yang panjang atau banyak pengguna serentak. Ini diterjemahkan terus ke dalam kos operasi yang lebih rendah.
Keluarga Granite 4.0 termasuk beberapa saiz untuk memenuhi keperluan yang berbeza. Barisan ini mempunyai dua model campuran-experts (MOE), H-Small (~ 9B parameter aktif) dan H-TINY (~ 1B aktif), bersama dengan model hibrid 3B yang padat. Model granit-4.0-h-kecil yang cemerlang dalam tugas-tugas yang mengikuti tugas (IFEVAL) dan sangat kompetitif dalam fungsi panggilan (BFCLV3), menurut data IBM. Src=”Data: Image/Svg+Xml; Nitro-emphy-id=mty1nzoxndk1-1; base64, phn2zyb2awv3qm94psiwidagmti4mca2ndai Ihdpzhropssixmjgwiibozwlnahq9ijy0mcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Ini menunjukkan kesediaan mereka untuk aliran kerja yang kompleks dan agenik yang biasa dalam tetapan perniagaan.
Untuk mengendalikan data perusahaan yang menuntut, model-model tersebut dilatih pada korpus 22-trilion yang besar. Mereka juga dilatih dalam urutan sampel sehingga 512K token panjang, memastikan prestasi yang mantap pada tugas-tugas yang memerlukan tingkap konteks yang sangat panjang. Granite 4.0 dikeluarkan di bawah lesen Apache 2.0 permisif, menggalakkan penggunaan dan pengubahsuaian yang luas. href=”https://www.iso.org/standard/88934.html”target=”_ blank”> yang dicapai ISO/IEC 42001: 2023 Pensijilan . Industri yang dikawal selia. Syarikat itu merancang untuk memperluaskan keluarga dengan variasi”berfikir”yang berfokus pada tahun 2025.