Tencent khổng lồ công nghệ Trung Quốc đang thách thức sự thống trị của phương Tây trong dịch AI, phát hành hai mô hình nguồn mở vượt trội hơn các nhà lãnh đạo ngành công nghiệp như Google Dịch và GPT-4. Được công bố vào ngày 1 tháng 9, các mô hình Hunyuan-MT-7B và Hunyuan-MT-Chimera-7B thống trị Hội thảo dịch WMT2025 uy tín.
Họ đã giành chiến thắng 30 trong số 31 cuộc thi mà họ tham gia. Chỉ với 7 tỷ thông số, các mô hình cung cấp hiệu suất tiên tiến trong gói hiệu quả tính toán. Bằng cách làm cho chúng có sẵn công khai trên khuôn mặt GitHub và ôm, Tencent nhằm mục đích tăng tốc đổi mới và đảm bảo một vị trí quan trọng trong bối cảnh AI toàn cầu.
Động thái này cung cấp các công cụ mạnh mẽ, dễ tiếp cận cho các nhà phát triển trên toàn thế giới. Bản phát hành nhấn mạnh một cú hích chiến lược để dân chủ hóa AI hiệu suất cao, đưa các khả năng dịch ưu tú vào tay một cộng đồng rộng lớn hơn trong bối cảnh cạnh tranh trong nước và toàn cầu. Hiệu suất: Thống trị điểm chuẩn WMT2025
Các mô hình mới của Tencent đã mang lại hiệu suất tuyệt vời tại Hội thảo về Dịch máy (WMT), một sự kiện hàng đầu để đánh giá các hệ thống đó. Các mô hình Hunyuan chiếm vị trí hàng đầu trong 30 trong số 31 cặp ngôn ngữ, một cuộc càn quét gần như tổng thể báo hiệu sự thay đổi trong bối cảnh cạnh tranh. Chúng liên tục vượt trội so với các hệ thống độc quyền lớn hơn nhiều, bao gồm Google Dịch, GPT-4.1, Claude 4 Sonnet và Gemini 2.5 Pro. Họ cũng vượt qua các hệ thống chuyên dụng như loạt Tháp tham số 72 tỷ đồng bằng tỷ suất lợi nhuận đáng kể. Đối với các doanh nghiệp và nhà phát triển, điều này chuyển trực tiếp sang chi phí suy luận thấp hơn, giảm nhu cầu phần cứng và khả năng tiếp cận cao hơn đối với các tổ chức mà không có cụm GPU lớn. Một trọng tâm quan trọng là các ngôn ngữ thiểu số Trung Quốc như Kazakh và Uyghur, thể hiện cam kết về sự đa dạng ngôn ngữ. Đường ống bắt đầu bằng việc đào tạo trước văn bản, tiếp theo là sự hoàn thiện trên dữ liệu cụ thể dịch thuật. Sau đó, nó chuyển sang giám sát tinh chỉnh, học tập củng cố và bước tăng cường”yếu”cuối cùng.
Quá trình tỉ mỉ này đảm bảo độ chính xác và lưu loát cao. Một sự đổi mới nổi bật là mô hình Hunyuan-MT-Chimera-7B. Được mô tả như một mô hình của nhóm”hoặc Fusion”, nó tích hợp nhiều đầu ra dịch từ các hệ thống khác nhau để tạo ra một kết quả vượt trội. Phương pháp này đã cải thiện hiệu suất kiểm tra trung bình 2,3%. Tổ chức dữ liệu được quản lý rộng lớn này rất quan trọng đối với các mô hình Khả năng xử lý ngôn ngữ cụ thể và văn hóa mà các bộ dữ liệu chung thường bỏ lỡ. Các nhà phát triển có thể truy cập Hunyuan-mt-7b model và