, i dizajnuar për të optimizuar xhiros, për të zvogëluar latencën dhe shkallën e shërbimeve të arsyetimit të AI, duke përmirësuar më tej aftësitë e vendosjes së Blackwell Ultra. Arkitekturat
Në vend që të krahasojnë drejtpërdrejt Blackwell Ultra me paraardhësin e tij të menjëhershëm, Nvidia theksoi avantazhet e performancës mbi çipat e saj të miratuar gjerësisht të epokës 2022 H100. Në mënyrë të veçantë, NVIDIA nxori në pah shpejtësinë e konkluzionit superior të Blackwell Ultra-duke e dhënë 1.5 herë performancën më të shpejtë të konkluzionit FP4. Një grup NVL72 që drejton modelin Deepseek-R1 671b tani gjeneron përgjigje në vetëm 10 sekonda, duke tejkaluar ndjeshëm kohën tipike të përgjigjes së 90 sekondave të H100. NVL72 përshpejton në mënyrë dramatike ngarkesat e arsyetimit të AI, duke bërë të mundur përgjigje gati-instante edhe në modelet më të mëdha,”tha CEO i NVIDIA Jensen Huang gjatë GTC Keynote. Udhëzimi ambicioz përfshin Vera Rubin Superchip, të planifikuar për t’u lëshuar në fund të vitit 2026. Emërtuar për nder të astronomit Vera Rubin, ky çip i gjeneratës tjetër do të bashkojë CPU-në Vera të dizajnuar me porosi të Nvidia, bazuar në arkitekturën e re të Olimpit, me GPU Rubin. Ai synon të ofrojë dyfish performancën e CPU-ve aktuale Grace dhe përmban deri në 288 GB memorje me bandë të lartë për GPU. Vetë CPU Vera përfshin 88 bërthama krahësh që mbështesin multithreading të njëkohshëm për 176 fije për prizë, të plotësuara nga një me shpejtësi të lartë 1.8TB/S NVLINK CORE-në-core thelbësore për ndërfaqen e saj të zgjeruar të CPU-GPU. Performanca.
[Përmbajtja e ngulitur]
Adoptimi i industrisë: Kompanitë që njoftojnë produkte që paraqesin NVIDIA Blackwell Ultra
Dell Technologies
Dell Technologies njoftoi mbështetjen e saj për Nvidia Blackwell Ultra GPUS në gjeneratën e fundit të Servers Ain MAXEDE A MAXIS A A MAXIS. Këto sisteme synojnë ndërmarrjet dhe institucionet kërkimore që kërkojnë infrastrukturë të fortë të AI, duke premtuar fitime të konsiderueshme në efikasitetin e ngarkesës së punës dhe përpunimin e modelit të madh. Konfigurimet do të mundësojnë kapacitete masive të kujtesës GPU ideale për detyra të arsyetimit dhe konkluzionit të AI në shkallë të gjerë, duke rritur ndjeshëm trajtimin e kompleksitetit të modelit AI dhe rrjedhën e të dhënave. Produktet synojnë të ofrojnë performancë të shkallëzueshme për kërkimin e AI, mësimin e makinerive dhe aplikacionet me intensitet të të dhënave, duke përmirësuar aftësitë e llogaritjes në mjediset e cloud dhe qendra të të dhënave. Këto konfigurime arrijnë ngarkesa të optimizuara të AI përmes performancës së përmirësuar, zvogëlimit të vonesës së konkluzionit dhe rritjes së shkallëzimit për ndërmarrjet që menaxhojnë vendosjet e përparuara të AI. duke synuar vendosjen e përshpejtuar të aplikacioneve të AI gjeneruese, agjentike dhe fizike. Këto zgjidhje u mundësojnë bizneseve të shkallëzojnë me shpejtësi aftësitë e tyre të AI, duke zvogëluar kompleksitetin e vendosjes dhe përmirësimin e performancës.
Inventec ka zbuluar sistemet e reja të serverëve që përdorin GPU-të Ultra Ultra të Blackwell të NVIDIA të dizajnuara për ngarkesa të punës në shkallë të gjerë të AI dhe vendosje të qendrave të të dhënave. Kompania synon të fuqizojë ndërmarrjet me platforma të fuqishme informatike AI, duke thjeshtuar adoptimin e modeleve të sofistikuara të AI dhe ngarkesave të punës. Aplikimet.