Alibaba telah mengeluarkan Qwen3, sebuah keluarga baru model bahasa besar yang bertujuan untuk bersaing dengan tawaran AI teratas dari OpenAI dan Google melalui ciri-ciri tersendiri seperti mod”pemikiran hibrid”dan sokongan berbilang bahasa yang luas. Dalam langkah yang selaras dengan siaran sumber terbuka sebelumnya seperti WAN 2.1, gergasi teknologi Cina membuat kebanyakan model dalam siri QWEN3 yang terdapat di bawah lesen APACHE 2.0 melalui platform termasuk github , , dan kaggle “Mod pemikiran”lalai membolehkan model melakukan penalaran langkah demi langkah untuk tugas-tugas yang kompleks seperti matematik atau pengekodan, sering mengeluarkan langkah-langkah pertengahan ini dalam tag sebelum tindak balas akhir.
Pemaju boleh bertukar-tukar tingkah laku ini menggunakan parameter enable_thinking atau tag spesifik/berfikir dan/no_think dalam arahan. The
dokumentasi amalan terbaik pada Model Model Face untuk Qwen3-0.6b-Fp8 Latihan, Senibina, dan Penggunaan Proses pasca latihan melibatkan empat peringkat, termasuk pembelajaran tetulang dan langkah-langkah khusus untuk menggabungkan keupayaan pemikiran dan tidak berfikir. Untuk tugas-tugas agensi, Qwen3 menyokong protokol konteks model (MCP), dengan Alibaba mengesyorkannya
Qwen3 memasuki landskap AI yang dinamik. Alibaba mendakwa keluarga Qwen merupakan ekosistem AI sumber terbuka terbesar di dunia dengan model derivatif, memetik lebih dari 100,000 pada muka yang memeluk. Qwen3 telah diintegrasikan ke dalam pembantu Quark AI Alibaba, yang menyebabkan chatbots Cina pada pengguna aktif bulanan pada bulan Mac 2025. Pelepasan ini mengikuti qwen 2.5 (Januari> Pasaran AI domestik yang kompetitif. Deepseek AI membuat gelombang penting dengan Deepseek V3 yang cekap (Disember 2024) dan model penalaran Deepseek R1 yang kuat (Jan 2025). Walau bagaimanapun, DeepSeek sejak itu menghadapi pengawasan antarabangsa yang cukup besar, termasuk penyiasatan privasi data di Itali, kajian dalaman oleh Microsoft dan Openai atas akses data yang tidak betul, dan kritikal