kiinalainen tekninen jättiläinen Tencent on haastava länsimainen määräävä asema AI-käännöksessä ja julkaisee kaksi avoimen lähdekoodin mallia, jotka ylittävät teollisuuden johtajat, kuten Google Translate ja GPT-4. Hunyuan-MT-7B ja Hunyuan-MT-Chimera-7B-mallit julkistettiin 1. syyskuuta arvostetun WMT2025-käännöspajan hallitsema mallit.
He voittivat 30 31 kilpailusta. Vain 7 miljardin parametrin avulla mallit tarjoavat huipputeknisen suorituskyvyn laskennallisesti tehokkaassa paketissa. Tekemällä ne julkisesti saataville GitHubilla ja halaamalla kasvoja, Tencent pyrkii nopeuttamaan innovaatioita ja varmistamaan avainasema maailmanlaajuisessa AI-maisemassa.
Tämä siirto tarjoaa tehokkaita, saavutettavia työkaluja kehittäjille ympäri maailmaa. Julkaisu korostaa strategista pyrkimystä demokratisoida korkean suorituskyvyn AI, asettamalla eliitin käännösominaisuudet laajemman yhteisön käsiin kovan kotimaisen ja globaalin kilpailun keskellä. Suorituskyky: WMT2025-vertailuarvojen hallitseminen
Tencentin uudet mallit toimittivat upean suorituskyvyn konekäännön työpajassa (WMT), joka on johtava tapahtuma tällaisten järjestelmien arvioimiseksi. Hunyuan-mallit ottivat kärkipaikan 30: ssa 31: stä kieliparista, melkein täydellisen pyyhkäisyn, joka merkitsee muutoksen kilpailumaisemassa.
7B-parametrimallit osoittivat, että koko ei ole kaikkea. Ne ylittivät jatkuvasti paljon suurempia omistusjärjestelmiä, mukaan lukien Google Translate, GPT-4.1, Claude 4 Sonet ja Gemini 2.5 Pro. He ylittivät myös erikoistuneet järjestelmät, kuten merkittävien marginaalien 72 miljardin parametritorni Plus-sarjan.
Tämä saavutus korostaa arkkitehtonisen innovaatioiden voimaa pelkän mittakaavan aikana. Yrityksille ja kehittäjille tämä kääntyy suoraan alhaisempiin päätelmäkustannuksiin, vähentyneisiin laitteistotarpeisiin ja suurempaan saatavuuteen organisaatioille, joilla ei ole massiivisia GPU-klustereita.
Mallit tukevat kaksisuuntaista käännöstä 33 kielellä, mukaan lukien kiinalaiset ja englanti ja vähemmän yleiset, kuten tšekki ja islanti. Keskeinen painopiste on kiinalaisissa vähemmistökielissä, kuten Kazakstanissa ja Uyghurissa, jotka osoittavat sitoutumisen kielelliseen monimuotoisuuteen.
konepellin alla: Viiden vaiheen putkilinja ja Chimera Fusion
Mallien menestys johtuu hienostuneesta viiden vaiheen koulutusprosessista. Putkilinja alkaa yleisen tekstin esisarjoituksella, jota seuraa translaatiokohtaisten tietojen hienosäätö. Sitten se siirtyy valvontaan hienosäätöön, vahvistusoppimiseen ja lopulliseen “heikkoon vahvaksi”vahvistusvaiheeseen.
Tämä huolellinen prosessi varmistaa suuren tarkkuuden ja sujuvuuden. Erottuva innovaatio on Hunyuan-MT-Chimera-7b-malli. Se on kuvattu”yhtyeen”tai”fuusio”-malliksi, se integroi useita käännöslähtöjä eri järjestelmistä yhden, paremman tuloksen tuottamiseksi. Tämä menetelmä paransi testin suorituskykyä keskimäärin 2,3%. Tämä laaja, kuratoitu data-säätiö on kriittinen mallien kyvylle käsitellä vivahtettua ja kulttuurisesti erityistä kieltä, jonka yleiset tietojoukot usein kaipaavat.
avoimen lähdekoodin kaikille: strateginen julkaisu GitHubille ja halaus kasvoille
liikkeelle, joka on suunniteltu Fosterin laaja-alaiseksi. Kehittäjät voivat käyttää Hunyuan-mt-7b-malli ja Halgging-kasvot, GitHubissa saatavana oleva täydellinen koodibase. Se antaa tutkijoille ja yrityksille mahdollisuuden rakentaa Tencentin työhön, integroimalla edistyneen käännöksen omiin sovelluksiinsa ilman rajoittavia lisensointia tai API-kustannuksia.
Päätös avoimen lähdekoodin kanssa on selkeä merkki Tencentin pyrkimyksestä tulla keskeiseksi toimijaksi Global AI-ekosysteemissä. Vaikeuttamalla yhteisöä, yritys voi ajaa innovaatioita ja perustaa arkkitehtuurinsa teollisuusstandardiksi luomalla palautesilmukan, joka voi nopeuttaa parannuksia.
osa suurempaa kuvaa: Tencentin monipuolinen AI-strategia
Tämä julkaisu ei ole eristetty tapahtuma, mutta avainkomponentti Tencentin laajemmasta, moni-parannusaineesta. Yhtiö rakentaa portfoliota erikoistuneita malleja kuin yksi, monoliittinen. Tähän sisältyy Hunyuan Turbo S välittömiin vastauksiin ja Hunyuan T1: lle monimutkaisten päättelyjen varalta.
Tämä monipuolinen lähestymistapa antaa Tencentille räätälöidä ratkaisuja tiettyihin käyttötapauksiin, asiakaskohtaisista chatboteista sisäiseen tietoanalyysiin. Se heijastaa myös käytännöllistä keskittymistä tehokkuuteen.
Äskettäisen ansaintapuhelun aikana Tencentin päästrategiajohtaja selitti: “Kiinalaiset yritykset yleensä priorisoivat tehokkuutta ja käyttöä-GPU-palvelimien tehokasta käyttöä. Ja se ei välttämättä heikennä kehitetyn tekniikan ja talon malli-strategian strategian lopullista tehokkuutta. Arkkitehtuurit, kuten Deepseek, osoittavat joustavan ja mukautuvan lähestymistavan. Kun AI-markkinat kehittyvät keskellä sääntelypainetta ja laitteistorajoituksia, Tencentin käytännöllinen, tehokkuus-ensimmäinen malli voisi osoittautua erittäin kestäväksi.