Chiński gigant technologiczny Tencent kwestionuje zachodnią dominację w tłumaczeniu AI, uwalniając dwa modele open source, które przewyższają liderów branży, takich jak Google Translate i GPT-4. Ogłoszone 1 września modele Hunyuan-MT-7B i Hunyuan-MT-Chimera-7B zdominowały prestiżowe warsztaty tłumaczeniowe WMT2025.
Wygrali 30 z 31 konkursów, które weszły. Z zaledwie 7 miliardami parametrów modele oferują najnowocześniejszą wydajność w pakiecie wydajnym obliczeniowym. Udostępnianie ich publicznie na GitHub i przytulanie twarzy Tencent ma na celu przyspieszenie innowacji i zapewnienie kluczowej pozycji w globalnym krajobrazie AI.
Ten ruch zapewnia potężne, dostępne narzędzia dla programistów na całym świecie. Wydanie podkreśla strategiczne dążenie do demokratyzacji wysokowydajnej sztucznej inteligencji, umieszczając elitarne możliwości tłumaczenia w ręce szerszej społeczności wśród konkurencji krajowej i globalnej.
Nowe modele Tencent zapewniły oszałamiającą wydajność na warsztatach dotyczących tłumaczenia maszynowego (WMT), wiodącego zdarzenia do oceny takich systemów. Modele Hunyuan zajęły pierwsze miejsce w 30 na 31 par językowych, prawie totalny zamiatanie, który sygnalizuje zmianę w konkurencyjnym krajobrazie. Modele parametrów 7B udowodniły, że rozmiar to nie wszystko. Konsekwentnie przewyższały znacznie większe systemy zastrzeżone, w tym Google Translate, GPT-4.1, Claude 4 Sonnet i Gemini 2.5 Pro. Przekroczyli także wyspecjalizowane systemy, takie jak 72 miliardy parametrowej serii Tower Plus według znaczących marginesów. To osiągnięcie podkreśla siłę innowacji architektonicznych nad samą skalą. W przypadku firm i programistów przekłada się to bezpośrednio na niższe koszty wnioskowania, zmniejszone potrzeby sprzętowe i większą dostępność organizacji bez masywnych klastrów GPU. Modele obsługują dwukierunkowe tłumaczenie w 33 językach, w tym głównych języków, takich jak chińskie i angielski, oraz mniej popularne, takie jak Czech i Ilandia. Kluczowy nacisk kładziony jest na chińskie języki mniejszości, takie jak Kazach i Uyghur, pokazując zaangażowanie w różnorodność językową. sukces modeli powstaje z wyrafinowanego pięciootniowego procesu treningu. Rurociąg zaczyna się od ogólnego wstępnego treningu tekstu, a następnie udoskonalania danych specyficznych dla tłumaczenia. Następnie przechodzi do nadzorowanego dostrajania, uczenia się wzmacniającego i ostatecznego „słabych do odtłuszczania” kroku zbrojenia. Ten skrupulatny proces zapewnia wysoką dokładność i płynność. Wyróżniającą się innowacją jest model Hunyuan-MT-Chimera-7b. Opisany jako model „zespołu” lub „fusion”, integruje wiele wyjść tłumaczenia z różnych systemów, aby wygenerować pojedynczy, doskonały wynik. Ta metoda poprawiła wydajność testu średnio o 2,3%. Raport techniczny Tencent szczegółowo opisuje zestaw danych szkoleniowych, który obejmował 1,3 biliona tokenów dla samych języków mniejszościowych. Ten rozległy, wyselekcjonowany fundament danych ma kluczowe znaczenie dla zdolności modeli do obsługi niuansowego i specyficznego kulturowego języka, którego często brakuje ogólnych zestawów danych. w ruchu zaprojektowanym w celu wspierania przyjęcia Widerpread, TENCENT TENCENT DO Zarówno modele, jak i ich źródło źródła. Deweloperzy mogą uzyskać dostęp do modelu hunyuan-mt-7b i Na przytulaniu twarzy, z kompletną bazą kodu dostępną na Github. To otwarte podejście kontrastuje z zamkniętymi, zastrzeżonymi modelami konkurentów, takich jak Openai i Google. Pozwala badaczom i przedsiębiorcom opierać się na pracy Tencent, integrując zaawansowane tłumaczenie do ich własnych aplikacji bez restrykcyjnych kosztów licencjonowania lub API. Decyzja o open source jest wyraźnym sygnałem ambicji Tencent, by zostać centralnym graczem w globalnym ekosystemie AI. Wzmacniając społeczność, firma może kierować innowacjami i ustalić swoją architekturę jako standard branżowy, tworząc pętlę sprzężenia zwrotnego, która może przyspieszyć ulepszenia. To nie jest izolowane zdarzenie, ale kluczowym elementem tendencyjnego, wielkiego, wielokrotnego, wielokrotnie przekształconej AI. Firma buduje portfel specjalistycznych modeli, a nie jeden, monolityczny. Obejmuje to Hunyuan Turbo S w przypadku natychmiastowych odpowiedzi i Hunyuan T1 dla złożonego rozumowania. To zdywersyfikowane podejście umożliwia tencent dostosowanie rozwiązań dla określonych przypadków użycia, od chatbotów skierowanych do klienta po analizę danych wewnętrznych. Odzwierciedla także pragmatyczne skupienie się na wydajności. Podczas ostatniego wezwania do zarobków, dyrektor ds. Strategii Tencent wyjaśnił: „Chińskie firmy ogólnie priorytetują wydajność i wykorzystanie-efektywne wykorzystanie serwerów GPU. I to niekoniecznie upośledza ostateczną skuteczność technologii, która jest rozwijana”. “ ta strategia opracowywania specjalizacji, a to niekoniecznie osłabia opłat wydajnościowej. Podobnie jak Deepseek pokazuje elastyczne i adaptacyjne podejście. W miarę ewolucji rynku AI wśród presji regulacyjnej i ograniczeń sprzętowych, pragmatyczny, najwyższy model Tencent może okazać się wysoce odporne. Pod maską: pięciostopniowe rurociąg i chimera fusion
Open-Source dla wszystkich: strategiczne wydanie Github i przytulanie twarzy
Część większego obrazu: Strategia AI Tecencenta