NVIDIA ka zbuluar Rubin CPX, një klasë e re e GPU me qëllim të krijuar për të përshpejtuar”fazën e kontekstit”të llogaritur-intensiv të konkluzionit të AI. Njoftuar sot, Chip është krijuar për të trajtuar ngarkesa masive të punës me mbi një milion shenja, të tilla si gjenerimi i videos dhe analiza e kodit në shkallë të gjerë. Rubin CPX është pjesë e platformës së ardhshme Vera Rubin, e cila u për herë të parë në GTC 2025 dhe pritet në fund të vitit 2026. Target=”_ bosh”> lëviz Krijon një kategori të re, të specializuar të harduerit, që synon përmirësimin e përfitimit të fabrikave të AI. Ai gjithashtu shtrin mbizotërimin e Nvidia mbi konkurrentët, shumë prej të cilëve ende po përpiqen të zhvillojnë alternativa me qëllime të përgjithshme.
Konkluzion i ndarë: Një arkitekturë e re për ngarkesat më të vështira të AI-së
Strategjia adreson një pengesë themelore në AI moderne. Siç shpjegon NVIDIA, konkluzioni nuk është një detyrë e vetme, por dy ngarkesa të veçanta pune me kërkesa të ndryshme. E dyta, faza e”gjenerimit”ose”deshifrimit”, është me intensitet memorje, duke prodhuar shenjën e daljes nga shenja. Për aplikimet me inpute masive, kjo krijon një problem të rëndësishëm të performancës. Sipas Shar Narasimhan, një drejtor produkti në NVIDIA, një GPU e vetme, me qëllime të përgjithshme është e detyruar të trajtojë të dy detyrat kur është vetëm optimizuar me të vërtetë për një, duke krijuar një kompromis arkitektonik që pengon efikasitetin. Ideja thelbësore është të përpunojmë këto faza në mënyrë të pavarur, duke lejuar optimizimin e synuar të burimeve të llogaritjes dhe kujtesës. href=”https://developer.nvidia.com/blog/nvidia-rubin-cpx-accelerates-inference-performance-and-efficiency-for-1m-context-workloads/”target=”_ Blank”> Përmirëson fluksin, zvogëlon vonesën, dhe rrit përdorimin e burimeve të përgjithshme .
isshtë një parim qendror i vizionit”Fabrika AI”e kompanisë, ku maksimizimi i performancës dhe kthimi i investimit është qëllimi përfundimtar. i inxhinierizuar për fazën e kontekstit. Ajo jep një PETAFLOPS të frikshme 30 të llogaritjes NVFP4 dhe është i pajisur me 128 GB memorie GDDR7.
Sipas NVIDIA, kjo është një zgjedhje e qëllimshme dhe me kosto efektive të projektimit; Duke zgjedhur GDDR7 mbi kujtesën më të shtrenjtë të brezit të lartë (HBM) që përdoret zakonisht në GPU-të e përqendruara në gjeneratë, kompania mund të sigurojë performancë adekuate për detyrën paraprake të lidhur me llogaritjen, ndërsa përmirëson ndjeshëm kthimin e përgjithshëm të sistemit në investime. href=”https://developer.nvidia.com/blog/nvidia-rubin-cpx-accelerates-fonference-performance-and-efficiency-for-1m-token-context-workloads/”target=”_ bosh”> tre herë më shpejt e vëmendjes së vëmendjes krahasuar me sistemin aktual GB300 nvl72. Metrika, pasi mekanizmi i vëmendjes është zemra llogaritëse e modeleve të transformatorit. Duke përshpejtuar është thelbësore për përpunimin në mënyrë efikase të sekuencave të të dhënave jashtëzakonisht të gjata që gjenden në kontekste milionëshe. Platforma e shërbimit të shpërndarë me performancë të lartë të vendosur në një raft të vetëm. Ky konfigurim jep një 8 exaflops tronditëse të fuqisë totale të llogaritjes NVFP4-një rritje prej 7.5-fish mbi GB300 NVL72 tashmë të frikshme GB300. E gjithë rafti është i ndërlidhur me Quantum-X800 Infiniband ose Spectrum-X Ethernet dhe orkestruar nga platforma e softuerit NVIDIA Dynamo. Platforma e plotë pritet të jetë e disponueshme në fund të vitit 2026. E gjithë industria e teknologjisë po garon për të zhvilluar përshpejtuesit e pronarit të AI, nga çipat e trenit të Amazon deri tek procesorët e MTIA të META. Megjithatë, shumë prej tyre kanë luftuar me vështirësinë e jashtëzakonshme të dizajnit të çipit. Ndërsa konkurrentët janë ende duke u përpjekur të ndërtojnë një GPU të vetme për të përputhur performancën e përgjithshme të Nvidia, udhëheqësi i tregut tashmë po ndan hapësirën e problemit me bashkë-përpunuesit e specializuar. Qasja e shkëputur e Nvidia paraqet një filozofi thelbësore të ndryshme arkitekturore. NVIDIA po forcon udhëheqjen e saj në treg. Me ardhjen e saj të planifikuar për fund të vitit 2026, Nvidia nuk është vetëm ndërtimi i patate të skuqura; Isshtë duke arkitekturuar të ardhmen e Qendrës së të Dhënave të AI, një përbërës i specializuar në të njëjtën kohë.