A Google fokozza ajánlatát az AI hardverdominanciájára. Csütörtökön a vállalat bejelentette legerősebb egyedi chipjét, az Ironwood TPU-t, amely most általánosan elérhetővé válik felhőügyfelei számára, az AI iránti új igények kielégítésére.

processzor kezeli a chatbotok mögötti valós idejű munkát. Ezen AI-rendszerek támogatása érdekében a Google új, költséghatékony Axion processzorokat is piacra dobott a mindennapi számítástechnikai feladatokhoz.

Ez a stratégiai lépés olyan kulcsfontosságú ügyfeleket céloz meg, mint az Anthropic, és kiélezi a Google kihívását a piacvezető Nvidiával szemben az AI-infrastruktúráért vívott kritikus harcban.

Ironwood: Egyedi szilíciumerőmű a következtetések korában

A Google a mesterséges intelligencia modellek következő generációjának meghajtására vertikálisan integrált stratégiára fogad.

Ennek az erőfeszítésnek a középpontjában a hetedik generációs tenzorfeldolgozó egység, az Ironwood áll, amelyet először áprilisban mutattak be. a Google által a „következtetés korának” nevezett konstrukció, amely a hatalmas modellek betanítása helyett a hasznos, érzékeny interakciók megvalósítása felé való elmozdulás.

Az Ironwood jelentős ugrást tesz lehetővé a teljesítményben, amelyet úgy terveztek, hogy megfeleljen mind a képzés, mind a mai legnagyobb AI-modellek kiszolgálásának összetett követelményeinek.

A Google szerint az új architektúra egy 10-szeres csúcsteljesítmény-javulás a TPU v5p elődjéhez képest, és több mint négyszer jobb teljesítmény chipenként az előző Trillium-generációhoz képest, a legnagyobb Irstawood rendszerrel érhető el

. 42,5 exaFLOPS FP8 számítási teljesítmény, amely elengedhetetlen a kis pontosságú aritmetikához, amely a modern mesterséges intelligencia munkaterhelését uralja.

Ez a nyers teljesítmény a hatékonyságra való összpontosítással párosul; Az Ironwood a Trillium wattonkénti teljesítménye kétszeresével büszkélkedhet, így ez a Google eddigi legenergiahatékonyabb chipje.

Google TPU Peak Flops Per Watt (Forrás: Google)

Ez a teljesítményszint csak akkor hasznos, ha skálázható, és az Ironwood architektúráját a hatalmas, összefüggő működésre tervezték.

9216 egyedi chip, amely lehetővé teszi, hogy egyetlen, egységes szuperszámítógépként működjenek. Ennek a rendszernek az alapja egy nagy sebességű Inter-Chip Interconnect (ICI) szövet, amely másodpercenként akár 9,6 terabit sávszélességet biztosít a chipek között, sűrű 3D Torus topológiát hozva létre.

Ez a hálózat lehetővé teszi a chipek számára, hogy hozzáférjenek egy kolosszális, megosztott 1,77 petabájtnyi nagy sávú memóriakészlethez. megbénítja a nagyszabású mesterséges intelligencia-feladatokat.

A chipek ezen csoportjainak összekapcsolására a Google dinamikus optikai áramkör-kapcsoló (OCS) hálózatot alkalmaz. Ez az újrakonfigurálható szövet kulcsfontosságú mind a méretezés, mind az ellenálló képesség szempontjából.

Amint azt a vállalat műszaki áttekintése részletezi, az OCS képes optikailag megkerülni az új, teljesen hibátlan áramköröket. egységek.

Google Ironwood TPU architektúra (Forrás: Google)

A hetekig tartó képzési feladatokat végző ügyfelek számára ez a dinamikus hibatűrés kritikus funkció, amely megakadályozza a költséges megszakításokat, és maximalizálja a teljes rendszer produktív üzemidejét.

Lényeges, hogy ez a fejlett hardver mélyen integrálva van egy rendszerre épülő, közösen megtervezett szoftverszintű optimalizálással. A magja a Google Accelerated Linear Algebra (XLA) fordítója, amely olyan népszerű keretrendszerekből, mint a JAX és PyTorch, magas szintű kódot fordít le rendkívül optimalizált gépi utasításokká.

A fordítóprogram kifejezetten a TPU speciális hardverét célozza meg, beleértve a sűrű Matrix Multiply Units (MXVPUUits) és Vector Processing Units (MXVPUUits) egységeket. A műveletek automatikus összeolvasztásával hatékony kernelekbe az XLA erőteljes „out-of-the-box” teljesítményt biztosít.

Következtetésképpen a vállalat tovább optimalizálta a köteget a , így hatalmas ereje elérhetőbbé válik a modelleket éles környezetben üzembe helyező fejlesztők számára.

A Google hardveres fejlesztése egy sokkal nagyobb, sokrétű infrastruktúra-stratégia összetevője.

A legutóbbi jelentésekben kiemeltük a Google néhány ambiciózus terveit, az Ausztrália moonsshot-adatközpontjától a karácsonyi sziget-adatközpontig. Suncatcher, amelynek célja, hogy TPU-val működő adatközpontokat építsen az űrben.

A kezdeményezések rávilágítanak a hatalmas erőforrásokra, amelyek szükségesek ahhoz, hogy az AI élvonalában maradhassanak.

[beágyazott tartalom]

Az Axion bővítése: Az általános célú számítások újradefiniálásához

a modern alkalmazásokhoz speciális alkalmazásokra és nagy teljesítményű alkalmazásokra van szükség. hatékony gerinc a mindennapi munkaterheléshez.

A Google ezt az egyéni Arm-alapú Axion CPU-portfólió bővítésével próbálja megoldani. A vállalat bejelentette, hogy az új N4A virtuális gépek előnézetben vannak, a C4A metal hamarosan megjelenő előnézete mellett, az első Arm-alapú bare-metal példányai mellett.

A kiváló ár-teljesítményre tervezett processzorok ellátják az AI-alkalmazásokat támogató általános célú feladatokat, beleértve az adat-előkészítést, a konténeres mikroszolgáltatásokat és a webszolgáltatást. src=”data:image/svg+xml;nitro-empty-id=MTY3OToxMjk3-1;base64,PHN2ZyB2aWV3Qm94PSIwIDAgMTI4MCA4ODIiI HdpZHRoPSIxMjgwIiBoZWlnaHQ9Ijg4MiIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj48L3N2Zz4=”>Google Axion CPU (Forrás: Google)

Az ügyfelek korai visszajelzései jelentős előnyöket mutatnak be. Szergej Koren, a ZoomInfo vezető infrastrukturális építésze méltatta az új példányokat, és kijelentette: „Az új N4A-példányok előnézetében 60%-os ár-teljesítménybeli javulást mértünk ezeknél a kulcsfontosságú munkaterheléseknél az x86-alapú társaikhoz képest.”

Hasonlóan a Vimeo 30%-os teljesítménynövekedésről számolt be a 60-as 8-as átszámításhoz képest. Virtuális gépek.

A Google az Axiont a hagyományos processzorok egyértelmű és hatékonyabb alternatívájaként pozicionálja.

Mark Lohmeyer, a Google Cloud mesterséges intelligenciájának és számítástechnikai infrastruktúrájának alelnöke és főigazgatója szerint „50%-kal nagyobb teljesítményűek lesznek, mint a hasonló x86 generációs processzorok, és 60%-kal jobb energiahatékonyságuk az x6p-nál.”

Stratégiai örökbefogadások és a mesterséges intelligencia fegyverkezési versenye

Az Anthropic hatalmas elkötelezettsége a Google egyedi szilíciumának erőteljes megerősítéseként szolgál. A Claude modellcsaládot fejlesztő mesterséges intelligencialaboratórium akár 1 millió TPU-hoz kíván hozzáférni, ami azt jelzi, hogy erős bizalommal vannak a platform képességei iránt mind a képzés, mind a következtetések tekintetében.

James Bradbury, a vállalat számítási részlegének vezetője a következőképpen magyarázta az előnyt: „Az Ironwood mind a következtetési teljesítményben, mind a képzési skálázhatóságban végzett fejlesztései segítenek a hatékony skálázásban, miközben megőrizzük az ügyfeleink által elvárt sebességet és megbízhatóságot.”

Ez a jelentős üzlet azonban egy összetett, többfelhős valóságban létezik. Bár a partnerség jelentős nyereség a Google számára, a jelentések egyértelművé teszik, hogy az Anthropic diverzifikált infrastruktúra-stratégiát tart fenn, és az Amazon Web Services továbbra is az elsődleges felhőszolgáltató.

Ez azt a szélesebb iparági trendet tükrözi, amely szerint a nagy mesterségesintelligencia-laboratóriumok elkerülik az egyetlen szállítótól való függőséget. Ez a stratégia korábban is volt tapasztalható, amikor az OpenAI elkezdte használni a Google Cloudot az alapvető Microsoft Azure-i infrastruktúra kiegészítésére. Az egyedi szilíciumra irányuló erőfeszítések egyenesen az Nvidia piaci dominanciájának megkérdőjelezésére irányulnak. Megdöbbentő befektetésre van szükség a versenyben.

A megugró kereslet kielégítése érdekében a Google a közelmúltban 85 milliárd dollárról 93 milliárd dollárra emelte az évre szóló tőkekiadások csúcsértékét.

Ez a hatalmas pénzügyi elkötelezettség azt bizonyítja, hogy a mögöttes hardver irányítása ma már kritikus versenyelőnynek tekintendő.

A PU rendkívül speciális kiépítése és a fa általános kiépítése révén. Az Axion CPU-k, a Google egy átfogó, közösen tervezett megoldást mutat be.

A vállalat arra fogad, hogy az MI-forradalom következő szakaszának megnyeréséhez optimalizált és költséghatékony hardverkészletet kínál ügyfeleinek a chiptől az adatközpontig.