Η Tencent Cuts Cuts GPU της Κίνας στρέφοντας τα αποτελεσματικά μοντέλα AI της Deepseek

Η Tencent λέει ότι μειώνει την εξάρτησή της από τα NVIDIA GPU με την ανάπτυξη μοντέλων AI από το Deepseek που προσφέρουν υψηλότερη απόδοση με λιγότερα τσιπς-μια μετατόπιση της εταιρείας περιγράφει ως μακροπρόθεσμη στρατηγική υποδομής με στόχο τη μείωση της εξάρτησης από το υλικό και τη βελτίωση της κλιμάκωσης. href=”https://www.mitrade.com/insights/news/live-news/article-8-707313-20250320″target=”_ blank”> Q4 2024 Κερδιστικές κλήσεις ήταν σε θέση να ελαχιστοποιήσει την κατανάλωση GPU κατά τη διατήρηση της παραγωγής.”Η βιομηχανία και εμείς, εντός της βιομηχανίας, παίρνουμε πολύ μεγαλύτερη παραγωγικότητα σε μια μεγάλη εκπαίδευση μοντέλων γλωσσών από υπάρχουσες GPU χωρίς να χρειάζεται να προσθέσουμε πρόσθετες GPU στο PACE που αναμενόταν προηγουμένως”, ανέφερε η εκτελεστική εξουσία. Εξήγησε περαιτέρω:

fast-tracked για απελευθέρωση μπροστά από το αρχικά του, το οποίο ήταν 8025. θα περιλαμβάνει πολυτροπικές δυνατότητες, ενισχύοντας τη χρησιμότητά του σε περιπτώσεις χρήσης επιχειρήσεων. Είναι επίσης βελτιστοποιημένα για την υπολογιστική στοίβα της Tencent, καθιστώντας τους πιο αποτελεσματικούς τόσο κατά τη διάρκεια της κατάρτισης όσο και της συμπερίληψης. Στην πραγματικότητα, η εταιρεία έχει κάνει μεγάλες εντολές των ειδικών για τα τσιπ H20 της Nvidia για να υποστηρίξει την ενσωμάτωση Deepseek σε εφαρμογές όπως το WeChat, όπως περιγράφεται λεπτομερώς σε αυτό

Το μοντέλο βελτίωσε την απόδοση σε πολύγλωσσα και πολυτροπικά καθήκοντα, αλλά απέτυχε να ξεπεράσει τα μικρότερα μοντέλα λογικής ειδικής συλλογισμού όπως το O3-Mini σε δομημένους τομείς όπως η μαθηματική και η επιστημονική λογική. Αυτό δείχνει πώς η προσέγγιση της Tencent-που επικεντρώνεται στην αποτελεσματικότητα των συμπερασμάτων και σε τοπικά προσαρμοσμένα μοντέλα-μπορεί να ξεχωρίζει ως πιο βιώσιμη στρατηγική. Ένα πρόσφατο ερευνητικό έγγραφο πρότεινε μια μέθοδο που ονομάζεται”δείγμα, ελέγχει και κλίμακα”, η οποία βελτιώνει τη συλλογιστική μέσω της αυτοκράτευσης των συμπερασμάτων. Ενώ αυτό αυξάνει τα υπολογιστικά γενικά έξοδα κατά το χρόνο εκτέλεσης, αποφεύγει το κόστος των μπαλονιών των μαζικών μοντέλων πριν από την κατάρτιση και θεωρείται ως μια πιο στοχοθετημένη προσέγγιση για τη βελτίωση των εργασιών της λογικής. Για την Tencent, αυτό προσφέρει μια διαδρομή για την κλιμάκωση των υπηρεσιών AI χωρίς υπερβολική δέσμευση σε περιορισμένα ή περιορισμένα αποθέματα GPU. Η Microsoft απέρριψε πρόσφατα μια επιλογή cloud GPU ύψους 12 δισεκατομμυρίων δολαρίων με την CoreWeave, η οποία αντ’αυτού αναλήφθηκε από την OpenAI. Η συμφωνία ύψους 11,9 δισεκατομμυρίων δολαρίων περιελάμβανε μερίδιο μετοχών ύψους 350 εκατομμυρίων δολαρίων από την OpenAi πριν από την IPO της CoreWeave. Αυτή η κίνηση επιτρέπει στο OpenAI να διαφοροποιήσει τις υπολογιστές της πέρα από τη Microsoft Azure.

Η Microsoft, εν τω μεταξύ, διπλασιάζεται στις τσιπς της, όπως οι επιταχυντές Azure Maia και Cobalt. Η εταιρεία μειώνει επίσης πίσω τη φυσική επέκταση. Η Microsoft ακύρωσε πολλαπλές μισθώσεις του κέντρου δεδομένων AI, συμπεριλαμβανομένης μιας εγκατάστασης 3,3 δισεκατομμυρίων δολαρίων στο Wisconsin, μετά την αναθεώρηση των προβλέψεων εσωτερικής ζήτησης. Οι αναλυτές της TD Cowen σημείωσαν ότι οι ενημερωμένες προβολές χρήσης OpenAI διαδραμάτισαν σημαντικό ρόλο στην απόφαση. Η στρατηγική πηγής μετά από τη στιγμή του Deepseek”Sputnik”

Η άνοδος του Deepseek ταιριάζει επίσης στην ευρύτερη στρατηγική της AI της Κίνας. Απαντώντας τους περιορισμούς των εξαγωγών των ΗΠΑ στις προηγμένες μάρκες, πολλές κινεζικές τεχνολογικές εταιρείες στρέφονται σε ανοιχτά προοπτικά τα μοντέλα τους. Για την Tencent, η υιοθέτηση πιο ανοιχτών και οικονομικά αποδοτικών μοντέλων του Deepseek ευθυγραμμίζεται με αυτές τις εθνικές και επιχειρησιακές προτεραιότητες. target=”_ blank”>”Στιγμιότυπο Sputnik” Για τη βιομηχανία AI των ΗΠΑ, με 1 τρισεκατομμύριο δολάρια για εν συντομία, η τάση θα εξαρτηθεί από το ντεμπούτο της. Οι Κινέζοι προγραμματιστές κατασκευάζουν πολύ ικανά μοντέλα AI χρησιμοποιώντας λιγότερα τσιπ και λιγότερα κεφάλαια που αμφισβητούν το παραδοσιακό μοντέλο επιτυχίας που βασίζεται αποκλειστικά σε κλίμακα και υπολογισμό. Η Tencent αναγκάστηκε να αγοράσει μεγάλες ποσότητες τσιπ H20 της Nvidia για να διατηρήσει την παροχή υπηρεσιών, παρά τις συνολικές μειώσεις στη χρήση της GPU. Αυτά τα μοντέλα εξακολουθούν να απαιτούν ισχυρό υλικό backend και η ικανότητα της Κίνας να διατηρεί την προσφορά παραμένει αβέβαιη υπό τους συνεχιζόμενους περιορισμούς των ΗΠΑ. Η αποτελεσματικότητα, όχι η επέκταση, γίνεται το νέο πρότυπο. Καθώς οι παγκόσμιες εταιρείες τεχνολογίας αξιολογούν το κόστος της κλιμάκωσης και την ευθραυστότητα των αλυσίδων εφοδιασμού, μοντέλα όπως το Deepseek R2 προσφέρουν ένα διαφορετικό σχέδιο: μικρότερο, πιο έξυπνο και ενδεχομένως πιο βιώσιμο.

Η Tencent Cuts Cuts GPU της Κίνας στρέφοντας τα αποτελεσματικά μοντέλα AI της Deepseek

Published by All Things Windows on March 22, 2025

IT Info

Η Tencent απελευθερώνει το μοντέλο συλλογισμού Hunyuan T1 AI, χτυπώντας το Deepseek R1, GPT-4.5, O1 σε πολλαπλά σημεία αναφοράς

IT Info

Οι φιλοδοξίες AI της Apple αντιμετωπίζουν νόμιμες θερμότητες και τεχνικές αποτυχίες

IT Info

Διορθώστε: Τα παράθυρα δεν μπορούν να επικοινωνούν με τη συσκευή ή τον πόρο

Η Tencent Cuts Cuts GPU της Κίνας στρέφοντας τα αποτελεσματικά μοντέλα AI της Deepseek

Published by All Things Windows on March 22, 2025

Related Posts

IT Info

Η Tencent απελευθερώνει το μοντέλο συλλογισμού Hunyuan T1 AI, χτυπώντας το Deepseek R1, GPT-4.5, O1 σε πολλαπλά σημεία αναφοράς

IT Info

Οι φιλοδοξίες AI της Apple αντιμετωπίζουν νόμιμες θερμότητες και τεχνικές αποτυχίες

IT Info

Διορθώστε: Τα παράθυρα δεν μπορούν να επικοινωνούν με τη συσκευή ή τον πόρο