Alibaba Cloud telah mengumumkan penurunan harga sebesar 85% untuk model AI penalaran visualnya, Qwen-VL-Max. langkah terjadi ketika raksasa teknologi Tiongkok, termasuk ByteDance dan Baidu, berjuang untuk mendominasi sektor AI perusahaan yang berkembang pesat.

Penurunan harga, yang menempatkan Qwen-VL-Max dengan harga 0,003 yuan ($0,00041) per seribu token, mencerminkan strategi agresif ByteDance untuk menurunkan biaya model AI penalaran visual diluncurkan pada awal bulan Desember.

Seri Qwen-VL Alibaba mencakup beberapa model canggih lainnya yang mengintegrasikan data visual dan tekstual untuk tugas-tugas seperti pembuatan teks gambar, menjawab pertanyaan visual, dan pembuatan konten multimodal. Jajarannya mencakup Qwen-VL, Qwen-VL-Chat, Qwen2-VL, dan QVQ-72B-Preview eksperimental. Qwen2-VL, dengan performa canggihnya, telah unggul dalam tolok ukur seperti MathVista dan DocVQA, sering kali melampaui pesaing terkemuka seperti GPT-4V OpenAI dan Gemini Ultra dari Google.

Dengan lebih dari 252 model AI generatif yang disetujui di Tiongkok pada tahun ini, pasarnya sudah jenuh, mendorong perusahaan untuk mengadopsi strategi penetapan harga dan teknologi yang inovatif untuk mengamankan pangsa pasar.

Penetapan Harga Strategis sebagai Pola yang Konsisten

Pengumuman bulan Desember merupakan penyesuaian harga AI besar ketiga yang dilakukan Alibaba pada tahun 2024, menyusul penurunan sebesar 55% pada bulan Februari untuk produk cloud inti dan diskon 97% pada bulan Mei untuk rangkaian AI Qwen. Langkah-langkah ini mencerminkan fokus yang konsisten pada keterjangkauan, yang bertujuan untuk menarik pelanggan perusahaan untuk menjelajahi alat AI canggih untuk proses bisnis dan analisis.

Dengan mengurangi biaya, Alibaba berupaya memposisikan penawaran AI-nya sebagai alat yang sangat diperlukan bagi perusahaan dalam menghadapi kompleksitas mengadopsi kecerdasan buatan. Penagihan berbasis token, yang membebankan biaya kepada pengguna untuk interaksi AI tertentu, telah menjadi hal penting dalam strategi penetapan harga, memungkinkan akses terukur ke model canggih tanpa investasi awal yang mahal.

Memajukan AI Multimodal dengan QVQ-72B

Awal minggu ini, Alibaba memperkenalkan QVQ-72B, model AI multimodal sumber terbuka yang mengintegrasikan kemampuan penalaran visual dan tekstual. Rilis ini merupakan pengembangan dari pendahulunya, Qwen2-VL-72B, yang meningkatkan fungsionalitas untuk penelitian ilmiah dan analisis tingkat lanjut.

Tolok ukur telah memvalidasi kemampuan QVQ-72B, dengan model tersebut mencapai skor 70,3 pada tolok ukur MMMU— tes yang dirancang untuk mengevaluasi penalaran multimodal tingkat universitas—dan unggul dalam MathVista dan OlympiadBench. Hasil ini menempatkan QVQ-72B di antara model sumber terbuka paling kompetitif di industri.

QwQ-32B: Model untuk Presisi Logis

Pada bulan November , Alibaba memperkenalkan QwQ-32B, model yang dirancang untuk penalaran logis, pengkodean, dan tugas matematika tingkat lanjut. Fitur komputasi waktu pengujiannya mengalokasikan sumber daya komputasi tambahan selama eksekusi, sehingga meningkatkan akurasi untuk masalah yang kompleks. Meskipun hal ini memperlambat waktu respons, presisi yang ditawarkan oleh QwQ-32B telah dipuji dalam benchmark dan aplikasi perusahaan.

Peluncuran QwQ-32B di bawah lisensi Apache 2.0 mencerminkan komitmen Alibaba untuk menyeimbangkan kolaborasi dan kontrol kepemilikan. Dengan berfokus pada AI yang berpusat pada penalaran, Alibaba bersaing langsung dengan model seperti R1-Lite-Preview dari DeepSeek dan model o1 dari OpenAI, yang keduanya memprioritaskan kedalaman logika dan penyelesaian masalah yang berulang.

Sektor AI generatif Tiongkok telah menyaksikannya perkembangan model yang pesat, dengan lebih dari 250 penawaran disetujui untuk penggunaan publik pada tahun 2024 saja. Kejenuhan ini telah memicu persaingan yang ketat di antara para pemimpin industri dan perusahaan rintisan, yang masing-masing bersaing untuk mendapatkan diferensiasi melalui harga dan fitur teknologi yang unik.

DeepSeek, misalnya, menekankan transparansi dengan model R1-Lite-Preview, yang menggunakan penalaran rantai pemikiran untuk memecah masalah menjadi langkah-langkah bertahap, memungkinkan pengguna melacak proses pengambilan keputusan. Sementara itu, ByteDance dan Alibaba fokus pada keterjangkauan untuk mendorong adopsi di pasar yang semakin ramai.

Categories: IT Info