IBM telah meluncurkan model AI granit 4.0 baru, menawarkan lompatan besar dalam efisiensi untuk bisnis.

Dirilis minggu ini, keluarga open-source menggunakan desain hibrida baru, pencampuran mamba-2 dan transformator arsitektur. Pendekatan ini memotong kebutuhan memori lebih dari 70 persen, yang menurunkan biaya perangkat keras untuk tugas-tugas kompleks.

Model dibangun untuk penggunaan perusahaan, berfokus pada kepercayaan dan kinerja tinggi. Mereka tersedia sekarang di watsonx.ai IBM , hugging face , dan platform lainnya.

Granite 4.0 menandai langkah IBM untuk menyediakan alat AI yang kuat namun terjangkau untuk pasar global, memposisikannya sebagai pesaing utama.

Rilis ini menandakan dorongan strategis oleh IBM untuk merebut kembali peran kepemimpinan dalam lanskap AI yang kuat. Pesaing.

Arsitektur hybrid untuk mengatasi masalah efisiensi AI

Di jantung granit 4.0 adalah solusi pintar untuk salah satu tantangan terbesar AI: Panjang Komputrainik Botol Panjang. Ini membuat mereka mahal untuk dijalankan.

Model baru IBM menghindari masalah ini dengan memadukan dua arsitektur yang berbeda. They combine highly efficient Mamba-2 layers with a small number of traditional Transformer blocks in a 9:1 ratio.

Mamba, a newer state-space model, memproses informasi secara linear, menjadikannya Jauh lebih cocok untuk dokumen panjang .

Desain hibrida ini memberikan yang terbaik dari kedua dunia. Ini mempertahankan akurasi kontekstual bahwa transformer dikenal untuk saat memanfaatkan kecepatan dan efisiensi memori mamba.

Hasilnya adalah pengurangan yang signifikan dalam perangkat keras yang diperlukan untuk menjalankan AI yang kuat, Menurunkan penghalang untuk masuk ke banyak organisasi. Para peneliti sedang mengeksplorasi berbagai metode, dari kaskade spekulatif Google hingga teknik kompresi lossless seperti DFLOAT11, semuanya bertujuan untuk membuat model besar lebih mudah diakses dan berkelanjutan. Inovasi arsitektur IBM adalah entri utama di bidang ini.

kinerja dan kepraktisan untuk beban kerja perusahaan

Fokus IBM tepat pada kinerja dan kepraktisan tingkat perusahaan. Perusahaan mengklaim arsitektur baru dapat memangkas persyaratan memori GPU lebih dari 70% selama inferensi, terutama untuk beban kerja dengan konteks panjang atau banyak pengguna simultan. Ini diterjemahkan langsung ke dalam biaya operasional yang lebih rendah.

Keluarga Granit 4.0 mencakup beberapa ukuran agar sesuai dengan kebutuhan yang berbeda. Lineup ini memiliki dua model campuran (MOE), H-Small (~ 9b parameter aktif) dan H-Tiny (~ 1b aktif), di samping model hibrida 3b yang padat.

Transformator 3B murni juga ditawarkan untuk platform yang belum mendukung desain hibrida.

P> power ini juga pada model hibrida. Model Granite-4.0-H-Small unggul pada tugas mengikuti instruksi (IFEVAL) dan sangat kompetitif dalam panggilan fungsi (BFCLV3), menurut data IBM.

Ini menunjukkan kesiapan mereka untuk alur kerja yang kompleks dan agen yang umum dalam pengaturan bisnis.

Untuk menangani data perusahaan yang menuntut, model-model dilatih pada korpus 22-triliun yang besar. Mereka juga dilatih pada urutan sampel hingga 512k token, memastikan kinerja yang kuat pada tugas-tugas yang membutuhkan jendela konteks yang sangat panjang.

model sumber terbuka yang dibangun di atas fondasi kepercayaan

Di luar kinerja, IBM menekankan kepercayaan dan pemerintahan yang bertanggung jawab. Granit 4.0 dirilis di bawah lisensi Apache 2.0 permisif, mendorong adopsi dan modifikasi yang luas.

Pendekatan terbuka ini merupakan pembeda yang jelas di pasar yang sering didominasi oleh sistem yang tertutup, granit. href=”https://www.iso.org/standard/88934.html” target=”_blank”>achieved ISO/IEC 42001:2023 certification.

This international standard verifies that IBM’s AI management system meets rigorous requirements for accountability, transparency, and data privacy, offering assurance to enterprises in regulated Industri.

Untuk meningkatkan keamanan lebih lanjut, setiap pos pemeriksaan model ditandatangani secara kriptografis, memungkinkan pengembang untuk memverifikasi keaslian dan integritasnya.

Komitmennya terhadap ekosistem yang terbuka dan aman adalah pusat dari strategi IBM. Perusahaan berencana untuk memperluas keluarga dengan varian”berpikir”yang berfokus pada penalaran pada tahun 2025.

Categories: IT Info