中国の技術大手テンセントは、AI翻訳における西洋の支配に挑戦し、Google TranslateやGPT-4などの業界リーダーよりも優れた2つのオープンソースモデルをリリースしています。 9月1日に発表されたHunyuan-MT-7BとHunyuan-Mt-Chimera-7Bモデルは、有名なWMT2025翻訳ワークショップを支配しました。わずか70億パラメーターで、モデルは計算効率の良いパッケージで最先端のパフォーマンスを提供します。 GithubとHugging Faceで公開されることにより、Tencentはイノベーションを加速し、グローバルAIランドスケープの重要なポジションを確保することを目指しています。

この動きは、世界中の開発者に強力でアクセス可能なツールを提供します。このリリースは、高性能AIを民主化するための戦略的な推進を強調し、国内および世界的な競争の激しい競争の中で、エリート翻訳能力をより広範なコミュニティの手に委ねる。 WMT2025ベンチマークを支配する

Tencentの新しいモデルは、そのようなシステムを評価するための主要なイベントであるMachine Translation(WMT)のワークショップで見事なパフォーマンスを提供しました。 Hunyuanモデルは、31の言語ペアのうち30枚でトップの地位を獲得しました。これは、競合状況の変化を示すほぼ2つの言語ペアであり、7b-parameterモデルはサイズがすべてではないことを証明しました。彼らは、Google Translate、GPT-4.1、Claude 4 Sonnet、Gemini 2.5 Proなど、はるかに大きな独自のシステムを常に上回っていました。彼らはまた、72億パラメータータワープラスシリーズなどの特殊なシステムを大幅にマージンで上回りました。企業や開発者の場合、これは推論コストの削減、ハードウェアのニーズの削減、および大規模なGPUクラスターのない組織のアクセスの向上に直接変換されます。

モデルは、中国語や英語などの主要な言語やチェコやアイスランドなどの一般的な言語を含む33の言語での双方向翻訳をサポートしています。重要な焦点は、KazakhやUyghurのような中国の少数言語に、言語の多様性へのコミットメントを示しています。パイプラインは、一般的なテキストの事前トレーニングから始まり、その後、翻訳固有のデータが改良されます。次に、監視された微調整、強化学習、最終的な「弱い」強化ステップに移動します。傑出した革新は、Hunyuan-Mt-Chimera-7Bモデルです。 「アンサンブル」または「フュージョン」モデルと呼ばれ、異なるシステムからの複数の翻訳出力を統合して、単一の優れた結果を生成します。この方法により、テストのパフォーマンスが平均2.3%改善されました。この広大でキュレーションされたデータファンデーションは、一般的なデータセットがしばしば見逃す微妙で文化的に特定の言語を処理するモデルの能力にとって重要です。開発者は、 hunyuan-mt-7bモデルにアクセスできます。 Chimeraバージョン hugging hugging Face、Githubで完全なコードベースを使用できます。

このオープンアプローチは、OpenaiやGoogleなどの競合他社の閉じた独自のモデルとは対照的です。これにより、研究者と企業はTencentの仕事に基づいて構築し、制限的なライセンスやAPIコストなしで独自のアプリケーションへの高度な翻訳を統合できます。コミュニティに力を与えることで、同社はイノベーションを推進し、業界標準としてのアーキテクチャを確立し、改善を加速できるフィードバックループを作成できます。同社は、単一のモノリシックなモデルではなく、特殊なモデルのポートフォリオを構築しています。これには、インスタント応答のためのHunyuan Turbo Sと複雑な推論のためのHunyuan T1が含まれます。

この多様なアプローチにより、Tencentは顧客向けのチャットボットから内部データ分析まで、特定のユースケースのソリューションを調整できます。また、効率性への実用的な焦点を反映しています。

最近の収益コール中、Tencentの最高戦略責任者は次のように説明しました。 Deepseekのようなアーキテクチャは、柔軟で適応的なアプローチを示しています。 AI市場が調節圧力とハードウェアの制約の中で進化するにつれて、Tencentの実用的で効率的なモデルは非常に回復力があることが証明される可能性があります。

Categories: IT Info