Nvidia julkistaa Rubin CPX: n, erikoistuneen GPU: n nopeuttamaan pitkän kontekstin AI-päätelmiä

; Tänään ilmoitettuna siru on suunniteltu käsittelemään massiivisia työmääriä, joissa on yli miljoona merkkiä, kuten videontuotanto ja laajamittainen koodianalyysi.

Tämä arkkitehtoninen innovaatio, jota Nvidia kutsuu”eriteltyihin päätelmiin”, erottaa prosessointitehtävät dramaattisesti tehokkuuden dramaattiseksi. Rubin CPX on osa tulevaa Vera Rubin-alustaa, joka kiusattiin ensimmäisen kerran GTC 2025: ssä ja jota odotetaan loppuvuodesta 2026.

Move luo uuden, erikoistuneen laitteistoluokan, jonka tavoitteena on parantaa AI-tehtaiden kannattavuutta. Se laajentaa myös NVIDIA: n määräävää asemaansa kilpailijoihin, joista monet yrittävät edelleen kehittää yleisiä joukkoja.

hajautetut päätelmät: Uusi arkkitehtuuri AI: n kovimpiin työmääriin

Strategia käsittelee perustavanlaatuista pullonkaulaa nykyaikaisessa AI: ssa. Kuten Nvidia selittää, päätelmät eivät ole yksi tehtävä, vaan kaksi erillistä työkuormaa, joilla on erilaiset vaatimukset.

Ensimmäinen, “konteksti”tai “etukäteen”vaihe, on laskentavaltainen, käsittelee laajoja tuloja, kuten koko koodibase tai videotiedosto. Toinen, “sukupolvi”tai “dekooda”vaihe, on muistiintensiivinen, tuottaen lähtötunnuksen tokenilla. Sovelluksissa, joissa on massiivisia tuloja, tämä luo merkittävän suorituskykyongelman.

Laskeva raskas etuvaihe voi aiheuttaa pitkiä viiveitä-joskus minuutteja-ennen vastauksen ensimmäinen merkki. NVIDIA: n tuotejohtaja Shar Narasimhanin mukaan yksi yleinen yleiskäyttöinen GPU pakotetaan käsittelemään molempia tehtäviä, kun se on optimoitu vain yhdelle, luomalla arkkitehtoninen kompromissi, joka estää tehokkuutta. Pääideana on käsitellä näitä vaiheita itsenäisesti, mikä mahdollistaa laskenta-ja muistiresurssien kohdennuksen optimoinnin. href=”https://developer.nvidia.com/blog/nvidia-rubin-cpx-accelerates-inference-permfornce-and-effication-for-1m–hoken-context-workloads/”Target=”_ tyhjä”> parantaa läpäisy, vähentää viivettä ja parantaa vain yleistä resurssien käyttöä

Tämä ohjelmistopohjainen hajotus oli keskeinen Uusien suorituskyvyn tietueiden asettaminen viimeisimmissä MLPERF-päätelmissä . Rubin CPX edustaa nyt tämän todistetun strategian fyysistä ilmenemismuotoa, siirtymällä ohjelmistojen optimoinnista tarkoitukseen rakennettuun piisiin.

Tämä keskittyminen erikoistuneisiin laitteistoihin merkitsee markkinoiden kypsymistä. Se siirtyy yli vain lisää raakavoimaa yhteen sirujen suunnitteluun ja kohti koko AI-työnkulun hienostuneempaa, täydellisempää pinoa optimointia. T

Se on keskeinen teema yrityksen”AI Factory”-visiosta, jossa suorituskyvyn ja sijoitetun pääoman tuoton maksimointi on lopullinen tavoite.

konepellin alla: Rubin CPX ja Vera Rubin NVL144-alusta

RUBIN CPX GPU, Sisäänrakennettuna suunniteltu kontekstivaiheeseen. Se tarjoaa valtavan 30 Petaflops NVFP4-laskennan ja on varustettu 128 Gt GDDR7-muistia.

NVIDIA: n mukaan tämä on tarkoituksellinen ja kustannustehokas suunnitteluvalinta; Valitsemalla GDDR7: n kalliimpaan korkean kaistanleveyden muistiin (HBM), jota käytetään tyypillisesti sukupolvessa keskittyvässä GPU: ssa, yritys voi tarjota riittävän suorituskyvyn laskennalliselle sidottuun etukäteen ja parantaa merkittävästi järjestelmän sijoitetun sijoitetun pääoman tuoton. href=”https://developer.nvidia.com/blog/nvidia-rubin-cpx-accelerates-inference-permfornce-and-effication-for-1mm-hoken-context-workloads/”Target=”_ tyhjä”> kolme kertaa nopeampaa huomion kiihtyvyyttä Metriikka, koska huomiomekanismi on muuntajamallien laskennallinen sydän. Sen kiihdyttäminen on välttämätöntä tehokkaasti prosessoimiseksi miljoonan sanottujen konteksteista löydettyjen erittäin pitkien datasekvenssien käsittelemiseksi.

GPU sisältää myös videon dekoodauksen ja koodauksen omistettua laitteistotuen, vastaamalla suoraan nousevien arvokkaiden sovellusten vaatimuksiin. Yhdessä telineessä sijaitsevassa hajautetussa toimitusalustassa. Tämä kokoonpano tarjoaa huikeat 8 exaflops kokonaismäärästä NVFP4: stä Computte Power-7,5-kertainen lisäys jo jo valtavan GB300 NVL72: n verrattuna.

Järjestelmätason tekniset tiedot ovat yhtä vaikuttavia, ja ne sisältävät 100TB suuren nopeuden muistia ja 1,7 pebytteä muisti-kaistanwidth. Koko teline on kytketty joko Quantum-X800 Infiniband-tai Spectrum-X-Ethernet-ohjelmaan ja NVIDIA Dynamo-ohjelmistoalustan järjestämä asiakkaille, jotka omaksuvat tavanomaisen Rubin-alustan ennen CPX: n saatavilla olevaa CPX-solmutelua, on myös vahvistanut myyvänsä erillisen CPX-solmujen telineen olemassa oleviin asennuksiin. Koko alustan odotetaan olevan saatavana vuoden 2026 lopussa.

lyijyn laajentaminen: Nvidia syventää kilpailukykyistä vallihautattaan

Tämä ilmoitus laskeutuu vaikeasti Nvidian kilpailijoille. Koko teknologiateollisuus kilpailee omistamaan Ama Amazonin hallitsija-siruista MTIA-prosessoreita omistajille. Silti monet ovat kamppailleet sirujen suunnittelun valtavien vaikeuksien kanssa. Vaikka kilpailijat yrittävät edelleen rakentaa yhden GPU: n vastaamaan NVIDIA: n yleistä suorituskykyä, markkinajohtaja on jo segmentoinut ongelmatilaa erikoistuneiden yhteisprosessorien kanssa.

jopa suora kilpailija AMD, joka äskettäin käynnisti suoran hyökkäyksen vaistoillaan MI350-sarjaan, on keskittynyt monoliittiselle suunnittelulle. NVIDIA: n hajotettu lähestymistapa edustaa pohjimmiltaan erilaista arkkitehtifilosofiaa.

Strategia näyttää toistavan NVIDIA: n toimitusjohtajan Jensen Huangin aiemmin ilmaiseman mielipiteen, joka kerran kysyi:”Mikä on ASIC: n rakentamisen kohta, jos se ei tule olemaan parempi kuin se, jonka voit ostaa?”Nvidian tuotejohtaja. Sen saapumisella vuoden 2026 lopulla Nvidia ei ole vain sirujen rakentaminen; Se on arkkitehtaa AI-tietokeskuksen tulevaisuutta, yksi erikoistunut komponentti kerrallaan.

Nvidia julkistaa Rubin CPX: n, erikoistuneen GPU: n nopeuttamaan pitkän kontekstin AI-päätelmiä

Published by All Things Windows on September 9, 2025

hajautetut päätelmät: Uusi arkkitehtuuri AI: n kovimpiin työmääriin

konepellin alla: Rubin CPX ja Vera Rubin NVL144-alusta

lyijyn laajentaminen: Nvidia syventää kilpailukykyistä vallihautattaan

IT Info

FTC käynnistää suuren koettimen AI-chatbot-turvallisuuteen teini-ikäisille, kohdistamalla Google, Meta ja Openai

IT Info

OpenAi avaa ChatgPT: n täyden virran uudella “kehittäjätilalla”, Powered by MCP-palvelimilla

IT Info

Kuinka satunnaiset laitteistoosoitteet otetaan käyttöön Windows 11: ssä (MAC-satunnaistaminen)

Nvidia julkistaa Rubin CPX: n, erikoistuneen GPU: n nopeuttamaan pitkän kontekstin AI-päätelmiä

Published by All Things Windows on September 9, 2025

hajautetut päätelmät: Uusi arkkitehtuuri AI: n kovimpiin työmääriin

konepellin alla: Rubin CPX ja Vera Rubin NVL144-alusta

lyijyn laajentaminen: Nvidia syventää kilpailukykyistä vallihautattaan

Related Posts

IT Info

FTC käynnistää suuren koettimen AI-chatbot-turvallisuuteen teini-ikäisille, kohdistamalla Google, Meta ja Openai

IT Info

OpenAi avaa ChatgPT: n täyden virran uudella “kehittäjätilalla”, Powered by MCP-palvelimilla

IT Info

Kuinka satunnaiset laitteistoosoitteet otetaan käyttöön Windows 11: ssä (MAC-satunnaistaminen)