nvidia έχει εισαγάγει το υλικό του στο GTC 2025, αποκαλύπτοντας το Blackwell Ultra GB300 και το Vera Rubin Superchips. Αυτές οι εξελίξεις στοχεύουν στην ενίσχυση των δυνατοτήτων AI σε διάφορους τομείς.

Blackwell Ultra GB300: Η ενισχυμένη απόδοση

Το Blackwell Ultra GB300, που θα αποσταλεί στο δεύτερο μισό του 2025, αντιπροσωπεύει μια σημαντική αναβάθμιση έναντι των προκαταρκτικών του. Το Blackwell Ultra GB300 SuperChip προσφέρει βελτιωμένη υπολογιστική ισχύ και εύρος ζώνης μνήμης, αντιμετωπίζοντας τις αυξανόμενες απαιτήσεις εφαρμογών AI.

Κάθε σύστημα GB300 ενσωματώνει 72 NVIDIA Blackwell Ultra GPU και 36 ARM NVIDIA GRACE CPU, προσφέροντας συλλογικά 1.400 petaflops της απόδοσης FP4 AI. Αυτή η διαμόρφωση αντιπροσωπεύει μια αύξηση 1,5 × στον πυκνό υπολογισμό FP4 σε σύγκριση με τον προκάτοχό του, το Blackwell B200. Η βελτίωση στο GB300 είναι η χωρητικότητα μνήμης του. Κάθε GPU είναι εξοπλισμένη με 288GB μνήμης HBM3E, συνολικού ύψους άνω των 20ΤΒ μνήμης GPU ανά σύστημα. Αυτή η σημαντική ενίσχυση της μνήμης επιτρέπει τη διαχείριση μεγαλύτερων μοντέλων και σύνολα δεδομένων AI, διευκολύνοντας πιο πολύπλοκες υπολογισμούς και ταχύτερους χρόνους επεξεργασίας. Ένα ενιαίο Ultra Chip διατηρεί τα ίδια 20 Petaflops του AI Compute ως Blackwell, αλλά επωφελείται από 50% αύξηση στη μνήμη υψηλού εύρους ζώνης (HBM3E), πηδώντας από 192GB σε 288GB.

Ομοίως, ένα πλήρες DGX GB300″Superpod”στεγάζει ακόμα 288 CPU και 576 GPU, παρέχοντας 11,5 exaflops του FP4 υπολογιστικού-ταυτόσημου με το αρχικό Superpod με βάση το Blackwell-αν και με αύξηση κατά 25% στη συνολική μνήμη, φτάνοντας τα 300TB. Αυτές οι αναβαθμίσεις μνήμης υποδεικνύουν ότι η NVIDIA δίνει προτεραιότητα στο χειρισμό μεγαλύτερων μοντέλων και στη βελτίωση της αποτελεσματικότητας του AI και όχι στην ακατέργαστη υπολογιστική ισχύ. Η εταιρεία ισχυρίζεται ότι η Blackwell Ultra παραδίδει 1,5 φορές την απόδοση των συμπερασμάτων FP4 του H100, αλλά το πιο εντυπωσιακό πλεονέκτημα είναι η ικανότητά της να επιταχύνει τη συλλογιστική AI.

Για παράδειγμα, ένα σύμπλεγμα NVL72 που τρέχει Deepseek-R1 671B-ένα μαζικό μεγάλο γλωσσικό μοντέλο-μπορεί τώρα να δημιουργήσει απαντήσεις σε μόλις δέκα δευτερόλεπτα, από 90 δευτερόλεπτα στο H100.

Η NVIDIA αποδίδει αυτή τη βελτίωση σε μια δέκα φορές αύξηση της ταχύτητας επεξεργασίας των διακριτικών, με το Blackwell Ultra να χειρίζεται 1.000 μάρκες ανά δευτερόλεπτο σε σύγκριση με τα 100 μάρκες του H100 ανά δευτερόλεπτο. Αυτά τα στοιχεία υποδεικνύουν ότι ενώ η Blackwell Ultra δεν υπερβαίνει δραματικά τον άμεσο προκάτοχό της, προσφέρει συναρπαστικά κέρδη αποτελεσματικότητας για εταιρείες που εξακολουθούν να μεταβαίνουν από την προηγούμενη γενιά αρχιτεκτονικών. Ο διάσημος αστρονόμος Vera Rubin, αυτό το τσιπ ενσωματώνει μια προσαρμοσμένη CPU (Vera) και GPU (Rubin).

Η Vera CPU, με βάση την αρχιτεκτονική του Olympus της Nvidia, αναμένεται να προσφέρει δύο φορές τις επιδόσεις των σημερινών CPU Grace. Η GPU RUBIN θα υποστηρίξει έως και 288GB μνήμης υψηλού εύρους ζώνης, ενισχύοντας σημαντικά τις δυνατότητες επεξεργασίας δεδομένων για σύνθετες εργασίες AI.

Η αρχιτεκτονική Vera Rubin διαθέτει σχεδιασμό διπλής GPU σε μία μόνο μήτρα, παρέχοντας 50 petaflops της απόδοσης συμπερασμάτων FP4 ανά τσιπ. Αυτός ο σχεδιασμός επιτρέπει την αποτελεσματικότερη επεξεργασία και τη μειωμένη καθυστέρηση σε εφαρμογές AI. Επιπλέον, η CPU Vera, που διαδέχθηκε το CPU Grace, περιλαμβάνει 88 πυρήνες προσαρμοσμένων βραχίονα με ταυτόχρονη πολλαπλή διάταξη, με αποτέλεσμα 176 νήματα ανά πρίζα. Διαθέτει επίσης μια διασύνδεση πυρήνα προς πυρήνα 1,8TB/S NVLink, ενισχύοντας τις ταχύτητες μεταφοράς δεδομένων μεταξύ των προηγούμενων αρχιτεκτονικών CPU και GPU. Η αύξηση 1,5 × 1,5 × αύξηση του πυκνού FP4 του B200 του B200 μεταφράζεται σε πιο αποτελεσματική επεξεργασία του φόρτου εργασίας του AI, επιτρέποντας την ταχύτερη εκπαίδευση και τους χρόνους συμπερασμάτων. Το επιθετικό χρονοδιάγραμμα ανάπτυξης της NVIDIA, με σχέδια για ετήσιες κυκλοφορίες νέων γενεών AI Chip, αντικατοπτρίζει τη δέσμευσή της να διατηρήσει μια ηγετική θέση στην αγορά υλικού AI.