Η Tencent λέει ότι μειώνει την εξάρτησή της από τα NVIDIA GPU με την ανάπτυξη μοντέλων AI από το Deepseek που προσφέρουν υψηλότερη απόδοση με λιγότερα τσιπς-μια μετατόπιση της εταιρείας περιγράφει ως μακροπρόθεσμη στρατηγική υποδομής με στόχο τη μείωση της εξάρτησης από το υλικό και τη βελτίωση της κλιμάκωσης. href=”https://www.mitrade.com/insights/news/live-news/article-8-707313-20250320″target=”_ blank”> Q4 2024 Κερδιστικές κλήσεις ήταν σε θέση να ελαχιστοποιήσει την κατανάλωση GPU κατά τη διατήρηση της παραγωγής.”Η βιομηχανία και εμείς, εντός της βιομηχανίας, παίρνουμε πολύ μεγαλύτερη παραγωγικότητα σε μια μεγάλη εκπαίδευση μοντέλων γλωσσών από υπάρχουσες GPU χωρίς να χρειάζεται να προσθέσουμε πρόσθετες GPU στο PACE που αναμενόταν προηγουμένως”, ανέφερε η εκτελεστική εξουσία. Εξήγησε περαιτέρω:
fast-tracked για απελευθέρωση μπροστά από το αρχικά του, το οποίο ήταν 8025. θα περιλαμβάνει πολυτροπικές δυνατότητες, ενισχύοντας τη χρησιμότητά του σε περιπτώσεις χρήσης επιχειρήσεων. Είναι επίσης βελτιστοποιημένα για την υπολογιστική στοίβα της Tencent, καθιστώντας τους πιο αποτελεσματικούς τόσο κατά τη διάρκεια της κατάρτισης όσο και της συμπερίληψης. Στην πραγματικότητα, η εταιρεία έχει κάνει μεγάλες εντολές των ειδικών για τα τσιπ H20 της Nvidia για να υποστηρίξει την ενσωμάτωση Deepseek σε εφαρμογές όπως το WeChat, όπως περιγράφεται λεπτομερώς σε αυτό
Το μοντέλο βελτίωσε την απόδοση σε πολύγλωσσα και πολυτροπικά καθήκοντα, αλλά απέτυχε να ξεπεράσει τα μικρότερα μοντέλα λογικής ειδικής συλλογισμού όπως το O3-Mini σε δομημένους τομείς όπως η μαθηματική και η επιστημονική λογική. Αυτό δείχνει πώς η προσέγγιση της Tencent-που επικεντρώνεται στην αποτελεσματικότητα των συμπερασμάτων και σε τοπικά προσαρμοσμένα μοντέλα-μπορεί να ξεχωρίζει ως πιο βιώσιμη στρατηγική. Ένα πρόσφατο ερευνητικό έγγραφο πρότεινε μια μέθοδο που ονομάζεται”δείγμα, ελέγχει και κλίμακα”, η οποία βελτιώνει τη συλλογιστική μέσω της αυτοκράτευσης των συμπερασμάτων. Ενώ αυτό αυξάνει τα υπολογιστικά γενικά έξοδα κατά το χρόνο εκτέλεσης, αποφεύγει το κόστος των μπαλονιών των μαζικών μοντέλων πριν από την κατάρτιση και θεωρείται ως μια πιο στοχοθετημένη προσέγγιση για τη βελτίωση των εργασιών της λογικής. Για την Tencent, αυτό προσφέρει μια διαδρομή για την κλιμάκωση των υπηρεσιών AI χωρίς υπερβολική δέσμευση σε περιορισμένα ή περιορισμένα αποθέματα GPU. Η Microsoft απέρριψε πρόσφατα μια επιλογή cloud GPU ύψους 12 δισεκατομμυρίων δολαρίων με την CoreWeave, η οποία αντ’αυτού αναλήφθηκε από την OpenAI. Η συμφωνία ύψους 11,9 δισεκατομμυρίων δολαρίων περιελάμβανε μερίδιο μετοχών ύψους 350 εκατομμυρίων δολαρίων από την OpenAi πριν από την IPO της CoreWeave. Αυτή η κίνηση επιτρέπει στο OpenAI να διαφοροποιήσει τις υπολογιστές της πέρα από τη Microsoft Azure. Η Microsoft, εν τω μεταξύ, διπλασιάζεται στις τσιπς της, όπως οι επιταχυντές Azure Maia και Cobalt. Η εταιρεία μειώνει επίσης πίσω τη φυσική επέκταση. Η Microsoft ακύρωσε πολλαπλές μισθώσεις του κέντρου δεδομένων AI, συμπεριλαμβανομένης μιας εγκατάστασης 3,3 δισεκατομμυρίων δολαρίων στο Wisconsin, μετά την αναθεώρηση των προβλέψεων εσωτερικής ζήτησης. Οι αναλυτές της TD Cowen σημείωσαν ότι οι ενημερωμένες προβολές χρήσης OpenAI διαδραμάτισαν σημαντικό ρόλο στην απόφαση. Η στρατηγική πηγής μετά από τη στιγμή του Deepseek”Sputnik”
Η άνοδος του Deepseek ταιριάζει επίσης στην ευρύτερη στρατηγική της AI της Κίνας. Απαντώντας τους περιορισμούς των εξαγωγών των ΗΠΑ στις προηγμένες μάρκες, πολλές κινεζικές τεχνολογικές εταιρείες στρέφονται σε ανοιχτά προοπτικά τα μοντέλα τους. Για την Tencent, η υιοθέτηση πιο ανοιχτών και οικονομικά αποδοτικών μοντέλων του Deepseek ευθυγραμμίζεται με αυτές τις εθνικές και επιχειρησιακές προτεραιότητες. target=”_ blank”>”Στιγμιότυπο Sputnik”