Tencent Open-Sources Twee elite AI-vertaalmodellen, beter dan Claude 4 Sonnet en Gemini 2.5 Pro

Chinese tech-gigant Tencent daagt de westerse dominantie uit in AI-vertaling en brengt twee open-source modellen uit die beter presteren dan marktleiders zoals Google Translate en GPT-4. Aangekondigd op 1 september domineerden de Hunyuan-MT-7B en Hunyuan-MT-Chimera-7B-modellen de prestigieuze WMT2025-vertaalworkshop.

Ze wonnen 30 van 31 competities die ze vonden. Met slechts 7 miljard parameters bieden de modellen state-of-the-art prestaties in een computationeel efficiënt pakket. Door ze publiekelijk beschikbaar te maken op GitHub en het gezicht te knuffelen, wil Tencent innovatie versnellen en een sleutelpositie in het wereldwijde AI-landschap veiligstellen.

Deze beweging biedt krachtige, toegankelijke tools voor ontwikkelaars wereldwijd. The release underscores a strategic push to democratize high-performance AI, putting elite translation capabilities into the hands of a broader community amid fierce domestic and global competition.

Small Models, Big Prestaties: domineren van de WMT2025-benchmarks

De nieuwe modellen van Tencent leverden een verbluffende prestatie op de workshop op het gebied van machine vertaling (WMT), een toonaangevend evenement voor het evalueren van dergelijke systemen. De Hunyuan-modellen namen de eerste plaats in in 30 van de 31 taalparen, een bijna-totale sweep die een verschuiving in het competitieve landschap aangeeft.

De 7B-parametermodellen bewezen dat niet alles is. Ze presteerden consequent beter dan veel grotere eigen systemen, waaronder Google Translate, GPT-4.1, Claude 4 Sonnet en Gemini 2.5 Pro. Ze overtroffen ook gespecialiseerde systemen zoals de 72-miljard parameterserie plus series met belangrijke marges.

Deze prestatie benadrukt de kracht van architecturale innovatie op grote schaal. Voor bedrijven en ontwikkelaars vertaalt dit zich rechtstreeks in lagere inferentiekosten, lagere hardwarebehoeften en een grotere toegankelijkheid voor organisaties zonder massale GPU-clusters.

De modellen ondersteunen tweerichtingsvertaling over 33 talen, inclusief belangrijke talen, inclusief belangrijke, zoals Chinees en Engels, en minder gemeenschappelijk, zoals Tsjechisch en IJslandisch. Een belangrijke focus ligt op Chinese minderheidstalen zoals Kazach en Uyghur, met een verplichting tot taaldiversiteit.

onder de motorkap: een vijf-fasen pijplijn en chimera fusion

De successtammen van de modellen komen uit een verfijnd trainingsproces van vijf stage. De pijplijn begint met pre-training voor algemene tekst, gevolgd door verfijning over vertaalspecifieke gegevens. Vervolgens gaat het over naar begeleid bij het afstemmen, versterking leren en een laatste”zwak tot sterke”versterkingsstap.

Dit nauwgezette proces zorgt voor een hoge nauwkeurigheid en vloeiendheid. Een opvallende innovatie is het Hunyuan-MT-Chimera-7B-model. Beschreven als een”ensemble”of”fusion”-model, integreert het meerdere vertaaluitgangen uit verschillende systemen om een enkel, superieur resultaat te genereren. Deze methode verbeterde de testprestaties met gemiddeld 2,3%.

het technische rapport van Tencent geeft een trainingsdataset weer met alleen 1,3 biljoen tokens voor minderheidstalen. Deze enorme, samengestelde gegevensstichting is van cruciaal belang voor de mogelijkheid van de modellen om genuanceerde en cultureel specifieke taal te verwerken die generieke datasets vaak missen.

open-source voor iedereen: een strategische release op GitHub en knuffelende gezicht

In een verhuizing die is ontworpen om een wijdverbreiding te bevorderen, heeft de wijdverbreide geadopteerde, het werk van de wijdverbreiding. Ontwikkelaars hebben toegang tot de Hunyuan-mt-7b Model en de

Tencent Open-Sources Twee elite AI-vertaalmodellen, beter dan Claude 4 Sonnet en Gemini 2.5 Pro

Published by All Things Windows on September 2, 2025

Small Models, Big Prestaties: domineren van de WMT2025-benchmarks

onder de motorkap: een vijf-fasen pijplijn en chimera fusion

open-source voor iedereen: een strategische release op GitHub en knuffelende gezicht

IT Info

Mistral voegt AI-geheugen toe, aangepaste MCP-connectoren met privacy-gerichte LE-chat-update

IT Info

Openai verwerft analysebedrijf Statsig voor $ 1,1 miljard, schudt het executive team om de productdivisie te versterken

IT Info

Dolby Vision 2 wordt gelanceerd met AI Smarts en ‘Authentic Motion’ om een revolutie teweeg te brengen in HDR

Tencent Open-Sources Twee elite AI-vertaalmodellen, beter dan Claude 4 Sonnet en Gemini 2.5 Pro

Published by All Things Windows on September 2, 2025

Small Models, Big Prestaties: domineren van de WMT2025-benchmarks

onder de motorkap: een vijf-fasen pijplijn en chimera fusion

open-source voor iedereen: een strategische release op GitHub en knuffelende gezicht

Related Posts

IT Info

Mistral voegt AI-geheugen toe, aangepaste MCP-connectoren met privacy-gerichte LE-chat-update

IT Info

Openai verwerft analysebedrijf Statsig voor $ 1,1 miljard, schudt het executive team om de productdivisie te versterken

IT Info

Dolby Vision 2 wordt gelanceerd met AI Smarts en ‘Authentic Motion’ om een ​​revolutie teweeg te brengen in HDR

Dolby Vision 2 wordt gelanceerd met AI Smarts en ‘Authentic Motion’ om een revolutie teweeg te brengen in HDR