Tencent's brengt zijn Hunyuan T1-redeneermodel uit, verslaat Deepseek R1, GPT-4.5, O1 over benchmarks

Tencent breidt zijn AI-portfolio uit met de lancering van Hunyuan T1, een door redeneren geoptimaliseerd model dat is ontworpen om te concurreren met de beste taalmodellen van China, inclusief Deepseek-R1.

ontwikkeld in eigen huis en ingezet op Tentent Cloud. Prestaties.

Hunyuan T1 is nu beschikbaar via API , ingebouwde toegang via tendent documenten en kunnen worden getest via een demo op knuffel gezicht . Het is afgestemd met behulp van versterkingsleren en intern benchmarkt op redeneringsgegevenssets zoals MMLU en GPQA.

tenten positioneert het model als een commercieel levensvatbaar hulpmiddel voor bedrijven die high-performance redeneren nodig hebben zonder de bodembelasting of licentiekosten gekoppeld aan westerse alternatieven.

turbo s zet het podium, t1 scherpt de focus

Het meest redenering van tenen tot op heden tot op heden, gepositioneerd om te voldoen aan de behoeften van bedrijfsgebruikers die gestructureerde logica, consistente langvormige generatie en verminderde hallucinatie vereisen.

redeneringsfocus: T1 wordt specifiek ontworpen voor complexe redeneringstaken, zoals gestructureerde probleemoplossing, wiskundige analyse, en beslissingsondersteuning. Tencent heeft versterkingstechnieken toegepast om de langdurige consistentie te verbeteren en feitelijke hallucinatie te minimaliseren. Chinese taaloptimalisatie: Het model presteert bijzonder goed in de Chinese taal logica en begrijpend lezen, in lijn met de focus van Tencent op gebruik van binnenlandse ondernemingsgebruik. Trainingsgegevens en infrastructuur: T1 werd volledig in eigen huis getraind met behulp van Tencent Cloud Infrastructure, waarvoor gegevensverblijf en naleving van Chinese regelgevingsstandaarden zorgden.

Benchmark Resultaten

Hunyuan T1 van Tencent is gepositioneerd als een high-performance redeneringsmodel geoptimaliseerd voor enterprise-grade taken in Chinese en wiskundige domeinen. Het model is volledig getraind en gehost op Tencent Cloud, met beschikbaarheid via API en integratie in Tencent Docs.

Gecombineerd met volledige binnenlandse hosting op Tencent Cloud en integratie in productiviteitstools zoals Tencent Docs, is Hunyuan T1 op maat gemaakt voor bedrijfsomgevingen die robuust logische, regulerende compliance, en inheemse taalfluency. Het benchmarkprofiel suggereert een duidelijke strategische focus: uitblinken in redenering en wiskunde met behoud van respectabele afstemming, taalbehandeling en prestaties van het genereren van codes.

Kennis: Hunyuan T1 scores 87.2 op MMLU Pro, overtreffende Deepseek R1 (84.0) en GPT-4.5 (86.1), hoewel O1 (89.3). Het volgt in GPQA Diamond met 69,3, lager dan Deepseek R1 (71.5) en O1 (75.7). Op C-Simpleqa scoort T1 67,9, achter Deepseek R1 (73.4). redeneren: T1 blinkt uit in deze categorie. Het behaalt de hoogste score op druppel F1 op 93,1, voorafgaand aan Deepseek R1 (92.2), GPT-4.5 (84.7) en O1 (90.2). Op zebra-logica scoort het 79,6, net achter O1 (87.9) maar ruim boven GPT-4.5 (53.7). Math: Hunyuan T1 scoort 96.2 op Math-500, net onder de Deepseek R1’s 97.3 en dicht bij O1’s 96.4. De AIME 2024-score is 78,2, iets onder Deepseek R1 (79.8) en O1 (79.2), maar ver boven GPT-4.5 (50.0). code: Het model scoort 64.9 op Livecodebench-marginaal onder deepseek R1 (65.9) en O1 (63.4), maar aanzienlijk voor GPT-4.5 (46.4). Dit positioneert het als capabel, hoewel niet uitzonderlijk, in codegeneratie. Tencent Hunyuan T1 Benchmarks vs Deepseek R1 GPT-4.5 O1 (Bron: Tencent) Chinese taal begrip: Hunyuan T1-scores 91.8 op C-eval en 90.0 op CMMLU, bindend deepseek R1 op beide en outperforming van GPT-4.5 door bijna 10 punten. Dit bevestigt zijn kracht in Chinese ondernemingscontexten. uitlijning: op Arenahard, T1-scores 91.9-Slightly achter GPT-4.5 (92.5) en Deepseek R1 (92.3), maar vóór O1 (90.7), wat wijst op robuuste waarde-afstemming en instructiecoherentie. instructie volgende: Het model verdient 81.0 op CFBench, enigszins onder Deepseek R1 (81.9) en GPT-4.5 (81.2) en 76.4 op cello, onder beide Deepseek R1 (77.1) en GPT-4.5 (81.4). Deze resultaten suggereren goede maar niet de beste instructie-compliance. Gereedschapsgebruik: Hunyuan T1 scoort 68.8 op T-eval, die het vermogen van AI meet om externe tools te bedienen. Het presteert beter dan Deepseek R1 (55.7) maar schiet tekort aan GPT-4.5 (81.9) en O1 (75.7). tent Hunyuan T1 Benchmarks vs Deepseek R1 GPT-4.5 O1 (Bron: Tencent)

Modelefficiëntie voldoet aan beperkingen in de praktijk

Terwijl het uitbreiden van de kosten van het verlagen van de kosten van de derden die de prestatievereisten vergaderen. Tijdens de inkomstenoproep van Q4 2024 legden leidinggevenden uit hoe de inferentie-efficiëntie-geen rekenschaal-hun implementatiekeuzes leidt.

Tencent heeft onlangs het gebruik van de DeepSeek’s architectuur-geoptimaliseerde modellen bevestigd om GPU-consumptie te verminderen en de doorvoer te verbeteren.”Chinese bedrijven geven over het algemeen prioriteit aan efficiëntie en gebruik-efficiënt gebruik van de GPU-servers. En dat is niet noodzakelijkerwijs de ultieme effectiviteit van de technologie die wordt ontwikkeld,”zei de Chief Strategy Officer van het bedrijf. In plaats van GPU-clusters te schalen, is het gericht op lagere latentie, aftrek-afgestemde modellen die lichter zijn om te draaien. De strategie weerspiegelt door onderzoek gesteunde methoden zoals voorbeeld, onderzoeken en schaal, die de nadruk leggen op verificatie bij inferentietijd in plaats van meer resource-zware training.

Ondanks deze efficiëntiefocus steunt Tencent niet weg van hardware-investeringen. Volgens een trendforce rapport , het bedrijf heeft grote ordening geplaatst voor nvidia’s h20 voor nvidia’s h20 voor nvidia’s h20 voor nvidia. CHIPS-Gespecialiseerde GPU’s voor de Chinese markt. Deze chips ondersteunen Tencent’s integratie van Deepseek-modellen in backend-services, waaronder degenen die WeChat voeden.

verschuivende politiek, verschuivende prioriteiten

De lancering van T1 komt te midden van verhoogde controle van Chinese AI-tools in het buitenland. On March 17, 2025, the U.S. Commerce Department Bastred Deepseek’s Applications Uit gebruik op federale overheidsapparaten, onder verwijzing naar privacyrisico’s en mogelijke banden met door de staat gecontroleerde infrastructuur. Aanvullende beperkingen kunnen volgen, waardoor grensoverschrijdende AI-acceptatie voor modellen is ontwikkeld die in China zijn ontwikkeld.

Thuis promoot de Chinese overheid actief nieuwere AI-startups. Reuters meldt dat BeiJing is destand van de baas Ontwikkelaar van Manus, een autnome AI-agent. Hoewel Tencent niet direct bij deze initiatieven betrokken is, zorgt het leiderschap op de binnenlandse cloud-en softwaremarkten ervoor dat het centraal blijft in het bredere AI-ecosysteem. href=”https://www.wsj.com/business/earnings/tentents-revenue-growth-accelerates-on-robust-gaming-business-5b12e9a7?utm_source=chatgpt.com”doel=”_ blank”> in Q4 2024, Tencent’s inkomsten 11% jaar-overjaar yuan . Een deel van die groei werd toegeschreven aan Enterprise AI-ontwikkeling, waarbij het bedrijf in 2025 verdere investeringen signaleert om zowel AI-infrastructuur met consumentengerichte als enterprise-klare AI-infrastructuur uit te breiden. Het om modelspecifieke mogelijkheden te leveren in verschillende zakelijke verticalen.

In plaats van een enkel groot model op te schalen, richt het bedrijf elke release af met nauwkeurige gebruiksscenario’s: complexe logica voor interne analyses, snelle interactie voor klantinterfaces.

Elk model is diep geïntegreerd in de cloudinfrastructuur van Tencent. Deze aanpak kan een beroep doen op bedrijven die op zoek zijn naar AI-oplossingen die volledig worden gehost in China en compliant zijn met nationale gegevensstandaarden.

In tegenstelling tot het traject van Openai-dat de release van het grootste en duurste model tot nu toe heeft vrijgegeven, GPT-4.5, in februari, verschijnt de strategie van de EENTENT meer. het uitbreiden van zijn rol in de snel evoluerende AI-sector van China.

De combinatie van het bedrijf van interne ontwikkeling, selectieve externe acceptatie en geïntegreerde productuitrol suggereert een strategie die is geworteld in aanpassingsvermogen in plaats van volume. Naarmate beleidsdruk en hardwarebeperkingen de markt hervormen, kan die aanpak steeds meer pragmatisch blijken te zijn.

Tencent’s brengt zijn Hunyuan T1-redeneermodel uit, verslaat Deepseek R1, GPT-4.5, O1 over benchmarks

Published by All Things Windows on March 23, 2025

turbo s zet het podium, t1 scherpt de focus

Benchmark Resultaten

Modelefficiëntie voldoet aan beperkingen in de praktijk

verschuivende politiek, verschuivende prioriteiten

IT Info

Schakel app-installaties uit op niet-systeemaandrijvingen in Windows 11

IT Info

Google onthult Gemini 2.5: hoe het opkomt tegen modellen van Openai, Xai, Anthropic en Deepseek

IT Info

Windows 10 Update KB5053643 met nieuwe functies en veel fixes die nu beschikbaar zijn. Download link

Tencent’s brengt zijn Hunyuan T1-redeneermodel uit, verslaat Deepseek R1, GPT-4.5, O1 over benchmarks

Published by All Things Windows on March 23, 2025

turbo s zet het podium, t1 scherpt de focus

Benchmark Resultaten

Modelefficiëntie voldoet aan beperkingen in de praktijk

verschuivende politiek, verschuivende prioriteiten

Related Posts

IT Info

Schakel app-installaties uit op niet-systeemaandrijvingen in Windows 11

IT Info

Google onthult Gemini 2.5: hoe het opkomt tegen modellen van Openai, Xai, Anthropic en Deepseek

IT Info

Windows 10 Update KB5053643 met nieuwe functies en veel fixes die nu beschikbaar zijn. Download link