Raksasa teknologi Cina Tencent menantang dominasi Barat dalam terjemahan AI, merilis dua model open-source yang mengungguli pemimpin industri seperti Google Translate dan GPT-4. Diumumkan pada 1 September, model Hunyuan-MT-7B dan Hunyuan-MT-Chimera-7b mendominasi lokakarya terjemahan WMT2025 yang bergengsi.

Mereka memenangkan 30 dari 31 kompetisi yang mereka masuki. Dengan hanya 7 miliar parameter, model menawarkan kinerja canggih dalam paket yang efisien secara komputasi. Dengan membuatnya tersedia untuk umum di GitHub dan memeluk wajah, Tencent bertujuan untuk mempercepat inovasi dan mengamankan posisi kunci dalam lanskap AI global.

Langkah ini menyediakan alat yang kuat dan dapat diakses untuk pengembang di seluruh dunia. Rilis ini menggarisbawahi dorongan strategis untuk mendemokratisasi AI berkinerja tinggi, menempatkan kemampuan terjemahan elit ke tangan komunitas yang lebih luas di tengah kompetisi domestik dan global yang sengit.

Model baru Tencent memberikan kinerja yang menakjubkan di lokakarya tentang terjemahan mesin (WMT), acara terkemuka untuk mengevaluasi sistem tersebut. Model Hunyuan mengambil posisi teratas dalam 30 dari 31 pasangan bahasa, sapuan hampir total yang menandakan pergeseran dalam lanskap kompetitif.

Model 7b-parameter membuktikan bahwa ukuran bukan segalanya. Mereka secara konsisten mengungguli sistem kepemilikan yang jauh lebih besar, termasuk Google Translate, GPT-4.1, Claude 4 Sonnet, dan Gemini 2.5 Pro. Mereka juga melampaui sistem khusus seperti menara 72 miliar-parameter plus dengan margin yang signifikan.

Prestasi ini menyoroti kekuatan inovasi arsitektur selama skala tipis. Untuk bisnis dan pengembang, ini diterjemahkan langsung ke biaya inferensi yang lebih rendah, berkurangnya kebutuhan perangkat keras, dan aksesibilitas yang lebih besar untuk organisasi tanpa kelompok GPU besar-besaran.

Model mendukung terjemahan dua arah di 33 bahasa, termasuk yang besar seperti bahasa Cina dan Inggris, dan kurang umum seperti Ceko dan Islandia. Fokus utama adalah pada bahasa minoritas Tiongkok seperti Kazakh dan Uyghur, menampilkan komitmen untuk keanekaragaman linguistik.

di bawah kap: pipa lima tahap dan chimera fusion

Keberhasilan model berasal dari proses pelatihan lima tahap yang canggih. Pipa dimulai dengan teks umum pra-pelatihan, diikuti oleh penyempurnaan pada data khusus terjemahan. Kemudian bergerak untuk mengawasi fine-tuning, pembelajaran penguatan, dan langkah penguatan”lemah ke kuat”. Inovasi yang menonjol adalah model Hunyuan-MT-Chimera-7b. Digambarkan sebagai model”ensemble”atau”fusion”, ini mengintegrasikan beberapa output terjemahan dari sistem yang berbeda untuk menghasilkan hasil tunggal yang unggul. Metode ini meningkatkan kinerja tes dengan rata-rata 2,3%.

Laporan teknis Tencent merinci dataset pelatihan yang mencakup 1,3 triliun token untuk bahasa minoritas saja. Landasan data yang luas dan dikuratori ini sangat penting bagi kemampuan model untuk menangani bahasa yang bernuansa dan spesifik budaya yang sering dilewatkan oleh dataset generik.

open-source untuk semua: rilis strategis pada GitHub dan Hugging Face

dalam gerakan yang dirancang untuk menumbuhkan adopsi yang luas, adanya adopsi, tem. Pengembang dapat mengakses model HUNYUAN-MT-7B dan Pada wajah memeluk, dengan basis kode lengkap yang tersedia di GitHub.

Pendekatan terbuka ini kontras dengan model yang tertutup dan berpemilik dari pesaing seperti Openai dan Google. Hal ini memungkinkan para peneliti dan bisnis untuk membangun di atas pekerjaan Tencent, mengintegrasikan terjemahan lanjutan ke dalam aplikasi mereka sendiri tanpa biaya lisensi atau API yang membatasi.

Keputusan untuk open-source adalah sinyal yang jelas tentang ambisi Tencent untuk menjadi pemain pusat dalam ekosistem AI global. Dengan memberdayakan masyarakat, perusahaan dapat mendorong inovasi dan menetapkan arsitekturnya sebagai standar industri, menciptakan loop umpan balik yang dapat mempercepat perbaikan.

bagian dari gambaran yang lebih besar: strategi AI yang beragam

Rilis ini bukan peristiwa yang terisolasi tetapi komponen kunci dari tencent’s poundent. Perusahaan ini sedang membangun portofolio model khusus daripada satu, monolitik. Ini termasuk HUNYUAN TURBO S untuk balasan instan dan HUNYUAN T1 untuk penalaran yang kompleks.

Pendekatan yang beragam ini memungkinkan Tencent untuk menyesuaikan solusi untuk kasus penggunaan tertentu, dari chatbots yang dihadapi pelanggan hingga analisis data internal. Ini juga mencerminkan fokus pragmatis pada efisiensi.

Selama panggilan pendapatan baru-baru ini, chief strategy officer Tencent menjelaskan,”Perusahaan-perusahaan Cina umumnya memprioritaskan efisiensi dan pemanfaatan yang efisien-pemanfaatan teknologi yang sama-sama juga dikembangkan.”Arsitektur seperti Deepseek menunjukkan pendekatan yang fleksibel dan adaptif. Saat pasar AI berkembang di tengah tekanan regulasi dan kendala perangkat keras, model pragmatis Tencent, efisiensi-pertama dapat terbukti sangat tangguh.