nvidia ka prezantuar Përparimet e saj të fundit në Superchips Inteligjencës Artificiale. Këto zhvillime synojnë të përmirësojnë aftësitë e AI në sektorë të ndryshëm. Blackwell Ultra GB300 SuperChip ofron fuqi të përmirësuar informatike dhe bandwidth të kujtesës, duke adresuar kërkesat në rritje të aplikacioneve të AI.
Eachdo sistem GB300 integron 72 NVIDIA Blackwell Ultra GPU dhe 36 CPU të NVIDIA GRACE me bazë ARM, duke ofruar kolektivisht 1.400 petaflops të performancës FP4 AI. Kjo konfigurim paraqet një rritje prej 1.5 × në llogaritjen e dendur të FP4 në krahasim me paraardhësit e tij, Blackwell B200. Përmirësimi i dukshëm në GB300 është kapaciteti i tij i kujtesës. Gdo GPU është e pajisur me 288 GB memorie HBM3E, duke arritur mbi 20TB memorie GPU për sistem. Kjo ngritje e konsiderueshme e kujtesës mundëson trajtimin e modeleve dhe të dhënave më të mëdha të AI, duke lehtësuar llogaritjet më komplekse dhe kohën e përpunimit më të shpejtë. Një çip i vetëm ultra mban të njëjtat 20 petaflops të AI Compute si Blackwell por përfiton nga një rritje prej 50% e kujtesës me bandë të lartë (HBM3E), duke u hedhur nga 192 GB në 288 GB. Në mënyrë të ngjashme, një në shkallë të plotë DGX GB300″SuperPod”ende strehon 288 CPU dhe 576 GPU, duke ofruar 11.5 exaflops të FP4 Computing-Identik për origjinalin SuperPod me bazë në Blackwell-megjithëse me një rritje prej 25% të kujtesës totale, tani duke arritur 300TB. Këto azhurnime të kujtesës tregojnë se NVIDIA po i jep përparësi trajtimit të modeleve më të mëdha dhe përmirësimin e efikasitetit të arsyetimit të AI sesa fuqia e papërpunuar e llogaritjes. Kompania pretendon se Blackwell Ultra jep 1.5x performancën e konkluzionit FP4 të H100, por avantazhi më i mrekullueshëm është aftësia e tij për të shpejtuar arsyetimin e AI. Për shembull, një grup NVL72 që drejton Deepseek-R1 671b-një model masiv i gjuhës së madhe-tani mund të gjenerojë përgjigje në vetëm dhjetë sekonda, nga 90 sekonda në H100.
NVIDIA i atribuon këtë përmirësim në një rritje dhjetëfish të shpejtësisë së përpunimit të shenjave, me Blackwell Ultra që merret me 1.000 shenja për sekondë në krahasim me 100 shenjat e H100 për sekondë. Këto shifra sugjerojnë që ndërsa Blackwell Ultra nuk e tejkalon në mënyrë dramatike paraardhësin e tij të menjëhershëm, ajo ofron fitime imponuese të efikasitetit për kompanitë që kalojnë ende nga arkitekturat e gjeneratës së mëparshme. Astronomi i njohur Vera Rubin, ky çip integron një CPU të krijuar me porosi (VERA) dhe GPU (Rubin). GPU Rubin do të mbështesë deri në 288 GB memorje me bandë të lartë, duke rritur ndjeshëm aftësitë e përpunimit të të dhënave për detyra komplekse të AI.
Arkitektura Vera Rubin përmban një dizajn të dyfishtë-GPU në një vdes të vetëm, duke dhënë 50 petaflops të performancës së konkluzionit FP4 për çip. Ky dizajn lejon një përpunim më efikas dhe vonesë të zvogëluar në aplikimet e AI. Ai gjithashtu krenohet me një ndërfaqe 1.8TB/S NVLink Core-to-core, duke rritur shpejtësinë e transferimit të të dhënave midis përbërësve të CPU dhe GPU. Rritja e GB300 1.5 × në llogaritjen e dendur të FP4 mbi B200 përkthehet në përpunim më efikas të ngarkesave të punës të AI, duke mundësuar kohë më të shpejtë të trajnimit dhe konkluzionit.
Afati kohor i zhvillimit agresiv të NVIDIA, me planet për lëshime vjetore të brezave të rinj të çipave AI, pasqyron angazhimin e tij për të mbajtur një pozicion udhëheqës në tregun e pajisjeve AI.