Η Tencent απελευθερώνει το μοντέλο συλλογισμού Hunyuan T1 AI, χτυπώντας το Deepseek R1, GPT-4.5, O1 σε πολλαπλά σημεία αναφοράς

Το Tencent επεκτείνει το χαρτοφυλάκιό του AI με την έναρξη του Hunyuan T1, ένα μοντέλο βελτιστοποιημένης από τη συλλογιστική, το οποίο έχει σχεδιαστεί για να ανταγωνιστεί τα κορυφαία γλωσσικά μοντέλα της Κίνας, συμπεριλαμβανομένου του DeepSeek-R1. Η απόδοση. href=”https://huggingface.co/spaces/tencent/hunyuan-t1″target=”_ blank”> demo στο αγκάλιασμα προσώπου . Συντονίζεται χρησιμοποιώντας μάθηση ενισχυτικής και εσωτερικά συγκριτικά σε σύνολα δεδομένων όπως το MMLU και το GPQA. Src=”Δεδομένα: εικόνα/svg+xml; nitro-empty-id=mtcyntoxmzux-1, base64, phn2zyb2awv3qm94psiwidagmtaynca3mz CiiHdpzhropsixmdi0iibozwlnahq9ijcznyigeg1sbnmm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>

Το Tencent τοποθετεί το μοντέλο ως εμπορικά βιώσιμο εργαλείο για τις επιχειρήσεις που χρειάζονται συλλογιστική υψηλής απόδοσης χωρίς το κόστος υπολογισμού ή το κόστος αδειοδότησης που συνδέεται με το φως των δυτικών εναλλακτικών λύσεων. Το μεγαλύτερο μοντέλο βελτιστοποιημένου από τη συλλογιστική του Tencent μέχρι σήμερα, τοποθετημένο για να καλύψει τις ανάγκες των επιχειρηματικών χρηστών που απαιτούν δομημένη λογική, συνεπή παραγωγή μακράς μορφής και μειωμένη ψευδαίσθηση. Η Tencent έχει εφαρμόσει τεχνικές μάθησης ενίσχυσης για τη βελτίωση της συνέπειας της μακράς μορφής και την ελαχιστοποίηση της πραγματικής ψευδαίσθησης. Βελτιστοποίηση της κινεζικής γλώσσας: Το μοντέλο εκτελεί ιδιαίτερα καλά στη λογική της κινεζικής γλώσσας και στις εργασίες κατανόησης ανάγνωσης, ευθυγραμμίζοντας με την εστίαση της Tencent στις περιπτώσεις χρήσης εγχώριων επιχειρήσεων. Τα δεδομένα και η υποδομή εκπαίδευσης: T1 εκπαιδεύτηκαν εξ ολοκλήρου εσωτερικά χρησιμοποιώντας την υποδομή cloud Tencent, εξασφαλίζοντας την κατοικία δεδομένων και τη συμμόρφωση με τα κινεζικά ρυθμιστικά πρότυπα.

Αποτελέσματα αναφοράς

Το Hunyuan T1 της Tencent τοποθετείται ως μοντέλο λογικής υψηλής απόδοσης βελτιστοποιημένο για εργασίες επιχειρήσεων σε κινεζικούς και μαθηματικούς τομείς. Το μοντέλο έχει εκπαιδευτεί και φιλοξενείται εξ ολοκλήρου στο Tencent Cloud, με διαθεσιμότητα μέσω API και ενσωμάτωση σε Tencent Docs. Το προφίλ αναφοράς του προτείνει μια σαφή στρατηγική εστίαση: Εξέλιξη στη συλλογιστική και τα μαθηματικά διατηρώντας ταυτόχρονα αξιοσέβαστη ευθυγράμμιση, χειρισμό γλωσσών και απόδοση παραγωγής κώδικα. Σχεδιάζει στο Diamond GPQA με 69,3, χαμηλότερα από το Deepseek R1 (71,5) και O1 (75,7). Στο C-Simpleqa, η Τ1 βαθμολογεί 67,9, πίσω από το Deepseek R1 (73,4). συλλογιστική: Το T1 υπερέχει σε αυτήν την κατηγορία. Επιτυγχάνει το υψηλότερο σκορ στο Drop F1 στις 93,1, μπροστά από το Deepseek R1 (92,2), το GPT-4,5 (84,7) και το O1 (90,2). Στη λογική Zebra, βαθμολογεί 79,6, ακριβώς πίσω από το O1 (87,9) αλλά πολύ πάνω από το GPT-4,5 (53,7). μαθηματικά: Hunyuan T1 βαθμολογεί 96,2 στο Math-500, ακριβώς κάτω από το Deepseek R1’s 97,3 και κοντά στο O1’s 96,4. Η βαθμολογία AIME 2024 είναι 78,2, ελαφρώς κάτω από το Deepseek R1 (79,8) και το O1 (79,2), αλλά πολύ πάνω από το GPT-4,5 (50,0). Κωδικός: Το μοντέλο βαθμολογεί 64,9 στο LiveCodeBench-Marginally κάτω από το Deepseek R1 (65,9) και το O1 (63,4), αλλά σημαντικά μπροστά από το GPT-4,5 (46,4). Αυτό το τοποθετεί ως ικανό, αν και όχι εξαιρετικό, στην παραγωγή κώδικα. Tencent Hunyuan T1 Benchmarks vs Deepseek R1 GPT-4.5 O1 (Πηγή: Tencent) Κατανόηση της κινεζικής γλώσσας: Hunyuan T1 βαθμολογίες 91,8 σε C-Eval και 90,0 σε CMMLU, δεσμεύοντας Deepseek R1 και στις δύο και να ξεπεράσει το GPT-4,5 με σχεδόν 10 σημεία. Αυτό επιβεβαιώνει τη δύναμή του σε κινεζικά επιχειρηματικά πλαίσια. Ευθυγράμμιση: στο Arenahard, T1 βαθμολογεί 91,9-ελαφρώς πίσω από το GPT-4,5 (92,5) και το Deepseek R1 (92,3), αλλά μπροστά από το O1 (90,7), υποδεικνύοντας ισχυρή ευθυγράμμιση αξίας και συνοχή της διδασκαλίας. Ακολουθούν: Το μοντέλο κερδίζει 81,0 στο CFBench, ελαφρώς κάτω από το Deepseek R1 (81,9) και το GPT-4,5 (81,2) και το 76,4 στο Cello, κάτω από το Deepseek R1 (77,1) και το GPT-4.5 (81.4). Αυτά τα αποτελέσματα υποδεικνύουν καλή αλλά όχι την καλύτερη συμμόρφωση με τις οδηγίες. Χρήση εργαλείων: Hunyuan T1 βαθμολογεί 68,8 στο T-Eval, το οποίο μετρά την ικανότητα της AI να λειτουργεί εξωτερικά εργαλεία. Υποστηρίζει το Deepseek R1 (55,7), αλλά υπολείπεται από το GPT-4,5 (81,9) και το O1 (75,7). tencent Hunyuan T1 Benchmarks vs Deepseek R1 GPT-4.5 O1 (Πηγή: Tencent)

Η απόδοση του μοντέλου ανταποκρίνεται σε πραγματικούς περιορισμούς, ενώ τα χαμηλότερα δαπάνες της απόδοσης, Κατά τη διάρκεια της κλήσης των κερδών του 2024, τα στελέχη εξήγησαν πώς η αποτελεσματικότητα των συμπερασμάτων-δεν υπολογίζει την κλίμακα-καθοδηγεί τις επιλογές ανάπτυξης.”Οι κινεζικές εταιρείες γενικά δίνουν προτεραιότητα στην αποτελεσματικότητα και την αξιοποίηση της χρήσης των διακομιστών GPU και αυτό δεν προκαλεί αναγκαστικά την τελική αποτελεσματικότητα της τεχνολογίας που αναπτύσσεται”, δήλωσε ο επικεφαλής στρατηγικής της εταιρείας. Αντί να κλιμακώνουν συστάδες GPU, επικεντρώνεται σε μοντέλα με χαμηλότερη καθυστέρηση, συμπεράσματα που είναι ελαφρύτερα για να τρέξουν. Η στρατηγική αντικατοπτρίζει τις μεθόδους που υποστηρίζονται από την έρευνα, όπως το δείγμα, η εξέταση και η κλίμακα, οι οποίες υπογραμμίζουν την επαλήθευση σε χρόνο συμπερασμάτων αντί για πιο βαριά εκπαίδευση. Σύμφωνα με το A Το Trendforce report τσιπς-εξειδικευμένες GPU για την κινεζική αγορά. Αυτά τα τσιπ υποστηρίζουν την ενσωμάτωση των μοντέλων Deepseek από την Tencent σε υπηρεσίες backend, συμπεριλαμβανομένων εκείνων που τροφοδοτούν το WeChat. On March 17, 2025, the U.S. Το τμήμα εμπορίου εμπόδισε τις εφαρμογές του Deepseek Από τη χρήση σε συσκευές της ομοσπονδιακής κυβέρνησης, αναφέροντας τους κινδύνους απορρήτου και τους πιθανούς δεσμούς με την ελεγχόμενη από το κράτος υποδομή. Μπορούν να ακολουθήσουν πρόσθετοι περιορισμοί, περιπλέκοντας τη διασυνοριακή υιοθέτηση AI για μοντέλα που αναπτύχθηκαν στην Κίνα. Το Reuters αναφέρει ότι Ο προγραμματιστής του Manus, ενός αυτοκράτορα AI Agent. Ενώ η Tencent δεν ασχολείται άμεσα με αυτές τις πρωτοβουλίες, η ηγεσία της στις εγχώριες αγορές σύννεφων και λογισμικού διασφαλίζει ότι παραμένει κεντρική στο ευρύτερο οικοσύστημα AI. href=”https://www.wsj.com/business/earnings/tencents-revenue-growth-accelerates-on-robust-gaming-business-5b12e9a7?utm_source=chatgpt.com”target=”_ bill”2024 γιουάν . Ένα μέρος αυτής της ανάπτυξης αποδόθηκε στην ανάπτυξη της επιχείρησης AI, με την εταιρεία να σηματοδοτεί περαιτέρω επενδύσεις το 2025 για να επεκτείνει τόσο την υποδομή AI-έτοιμη για την AI-έτοιμη από την επιχείρηση. Απαντήσεις-Ενεργοποιεί την παροχή δυνατοτήτων συγκεκριμένων μοντέλων σε διαφορετικές επιχειρηματικές κατακόρυφες. Αυτή η προσέγγιση μπορεί να προσελκύσει επιχειρήσεις που αναζητούν λύσεις AI που φιλοξενούνται πλήρως στην Κίνα και συμμορφώνονται με τα εθνικά πρότυπα δεδομένων. Η επέκταση του ρόλου της στον ταχέως εξελισσόμενο τομέα AI της Κίνας.

Ο συνδυασμός της εσωτερικής ανάπτυξης της εταιρείας, η επιλεκτική εξωτερική υιοθεσία και η ολοκληρωμένη ανάπτυξη προϊόντων υποδηλώνουν μια στρατηγική που βασίζεται στην προσαρμοστικότητα και όχι στον όγκο. Καθώς οι περιορισμοί της πίεσης πολιτικής και του υλικού αναμορφώνουν την αγορά, η προσέγγιση αυτή θα μπορούσε να αποδειχθεί όλο και πιο ρεαλιστική.

Η Tencent απελευθερώνει το μοντέλο συλλογισμού Hunyuan T1 AI, χτυπώντας το Deepseek R1, GPT-4.5, O1 σε πολλαπλά σημεία αναφοράς

Published by All Things Windows on March 23, 2025

Αποτελέσματα αναφοράς

IT Info

Το Meta αντιμετωπίζει πρόστιμο 1 δισεκατομμυρίου δολαρίων για το μοντέλο «αμοιβής ή συγκατάθεσης»

IT Info

Η Furiosaai απορρίπτει την προσφορά απόκτησης 800 εκατομμυρίων δολαρίων της Meta, επιλέγει την ανεξαρτησία στον αγώνα AI Chip

IT Info

Η προχωρημένη φωνητική λειτουργία του ChatGpt επεκτείνεται στον ιστό και βελτιώνει τη ροή συνομιλίας

Η Tencent απελευθερώνει το μοντέλο συλλογισμού Hunyuan T1 AI, χτυπώντας το Deepseek R1, GPT-4.5, O1 σε πολλαπλά σημεία αναφοράς

Published by All Things Windows on March 23, 2025

Αποτελέσματα αναφοράς

Related Posts

IT Info

Το Meta αντιμετωπίζει πρόστιμο 1 δισεκατομμυρίου δολαρίων για το μοντέλο «αμοιβής ή συγκατάθεσης»

IT Info

Η Furiosaai απορρίπτει την προσφορά απόκτησης 800 εκατομμυρίων δολαρίων της Meta, επιλέγει την ανεξαρτησία στον αγώνα AI Chip

IT Info

Η προχωρημένη φωνητική λειτουργία του ChatGpt επεκτείνεται στον ιστό και βελτιώνει τη ροή συνομιλίας