Tencent Open-Sources Zwei Elite-AI-Übersetzungsmodelle, die Claude 4 Sonnet und Gemini 2.5 Pro übertreffen

chinesisches Tech-Riese Tencent stellt die westliche Dominanz bei der KI-Übersetzung in Frage und veröffentlicht zwei Open-Source-Modelle, die Branchenführer wie Google Translate und GPT-4 übertreffen. Am 1. September kündigte die Modelle Hunyuan-MT-7B und Hunyuan-Mt-Chimera-7B den prestigeträchtigen WMT2025-Übersetzungsworkshop. Mit nur 7 Milliarden Parametern bieten die Modelle eine modernste Leistung in einem rechnerisch effizienten Paket. Tencent macht sie auf Github und Umarmung öffentlich zur Verfügung, um die Innovation zu beschleunigen und eine Schlüsselposition in der globalen KI-Landschaft zu sichern. Die Veröffentlichung unterstreicht einen strategischen Vorstoß zur Demokratisierung von Hochleistungs-KI und steckt Elite-Übersetzungsfähigkeiten in die Hände einer breiteren Gemeinschaft inmitten heftiger inländischer und globaler Wettbewerb. Leistung: Dominieren der neuen Modelle von WMT2025

Tencent lieferten eine atemberaubende Leistung im Workshop on Machine Translation (WMT), ein führendes Ereignis für die Bewertung solcher Systeme. Die Hunyuan-Modelle nahmen in 30 von 31 Sprachpaaren den Spitzenplatz ein, ein nahezu einwandfreier Sweep, der eine Verschiebung der Wettbewerbslandschaft signalisiert. Sie übertrafen konsequent viel größere proprietäre Systeme, darunter Google Translate, GPT-4.1, Claude 4 Sonett und Gemini 2.5 Pro. Sie übertrafen auch spezialisierte Systeme wie die 72-Milliarden-Parameter-Tower Plus-Serie durch bedeutende Margen. Für Unternehmen und Entwickler führt dies direkt auf niedrigere Inferenzkosten, reduzierte Hardwareanforderungen und eine größere Zugänglichkeit für Organisationen ohne massive GPU-Cluster. Ein zentraler Schwerpunkt liegt auf chinesischen Minderheitensprachen wie Kasach und Uyghur und zeigt eine Verpflichtung zur sprachlichen Vielfalt. Die Pipeline beginnt mit dem allgemeinen Text vor dem Training, gefolgt von Verfeinerung von übersetzungsspezifischen Daten. Anschließend bewegt sich die Feinabstimmung, das Verstärkungslernen und einen endgültigen „schwachen“ Verstärkungsschritt. Eine herausragende Innovation ist das Hunyuan-Mt-Chimera-7b-Modell. Es wird als”Ensemble”oder”Fusion”-Modell beschrieben und integriert mehrere Translationsausgänge aus verschiedenen Systemen, um ein einzelnes, überlegenes Ergebnis zu erzeugen. Diese Methode verbesserte die Testleistung um einen Durchschnitt von 2,3%.

Tencents technischer Bericht beschreibt einen Trainingsdatensatz, der nur 1,3 Billionen Token für Minderheitensprachen enthielt. Diese umfangreiche, kuratierte Datenstiftung ist für die Fähigkeit der Modelle von entscheidender Bedeutung, nuancierte und kulturell spezifische Sprache zu bewältigen, die generische Datensätze häufig vermissen. Entwickler können auf die hunyuan-mt-7b-Modell zugreifen und das

Tencent Open-Sources Zwei Elite-AI-Übersetzungsmodelle, die Claude 4 Sonnet und Gemini 2.5 Pro übertreffen

Published by All Things Windows on September 2, 2025

IT Info

Umfrage: iPhone 17 Upgrade intent High, aber foldable Verzögerung stellt ein großes Risiko dar, das ein großes Risiko darstellt

IT Info

Meta Quest: Microsoft fügt der Mixed Reality-Link-App Windows on Arm-Unterstützung hinzu

IT Info

Elon Mosch

Tencent Open-Sources Zwei Elite-AI-Übersetzungsmodelle, die Claude 4 Sonnet und Gemini 2.5 Pro übertreffen

Published by All Things Windows on September 2, 2025

Related Posts

IT Info

Umfrage: iPhone 17 Upgrade intent High, aber foldable Verzögerung stellt ein großes Risiko dar, das ein großes Risiko darstellt

IT Info

Meta Quest: Microsoft fügt der Mixed Reality-Link-App Windows on Arm-Unterstützung hinzu

IT Info

Elon Mosch