Google po përshkallëzon ofertën e saj për dominimin e harduerit të AI. Të enjten, kompania prezantoi çipin e saj më të fuqishëm të personalizuar, Ironwood TPU, tani po hyn në disponueshmërinë e përgjithshme të klientëve të saj

ilt të përgjithshëm

u për përfundimin e AI, ky procesor i ri trajton punën në kohë reale pas chatbots. Për të mbështetur këto sisteme të AI, Google lançoi gjithashtu procesorë të rinj Axion me kosto efektive për detyrat e përditshme informatike.

Kjo lëvizje strategjike synon klientët kryesorë si Anthropic dhe mpreh sfidën e Google ndaj liderit të tregut Nvidia në betejën kritike për infrastrukturën e AI.

Ironwood: Një fuqi e personalizuar siliconi për epokën e fuqisë së Google-it, modeli i ardhshëm

To AIh2> është duke vënë bast mbi një strategji të integruar vertikalisht.

Në qendër të kësaj përpjekjeje është njësia e saj e përpunimit tensor të gjeneratës së shtatë, Ironwood, e cila u zbulua për herë të parë në prill.

Tani duke kaluar në disponueshmërinë e përgjithshme, çipi është ndërtuar me qëllim për atë që Google e quan”epoka e konkluzioneve”, zhvendosja e modeleve të dobishme për zbatimin e tyre nga trajnimi, duke i zbatuar ato në mënyrë masive. shkallë.

Ironwood ofron një hap të rëndësishëm në performancë, i projektuar për të përballuar kërkesat komplekse si të trajnimit ashtu edhe të shërbimit të modeleve më të mëdha të inteligjencës artificiale të sotme.

Sipas Google, arkitektura e re ofron një 10 herë përmirësim të performancës maksimale krahasuar me paraardhësin e tij TPU v5p dhe më shumë se katër herë performancë më të mirë për çdo çip, në krahasim me gjeneratën e mëparshme të një çipi. Sistemi Ironwood mund të arrijë një fuqi marramendëse prej 42,5 ekzaFLOPS të fuqisë llogaritëse FP8, një metrikë thelbësore për aritmetikën me saktësi të ulët që dominon ngarkesat moderne të AI.

Kjo fuqi e papërpunuar shoqërohet me fokusin në efikasitet; Ironwood krenohet me dy herë performancën për vat sesa Trillium, duke e bërë atë çipin më efikas të Google deri më sot.

Google TPU Peak Flops Per Watt (Burimi: Google)

Ky nivel i performancës është i dobishëm vetëm nëse mund të shkallëzohet, dhe arkitektura e Ironwood është projektuar për funksionim masiv dhe koheziv.

up to”

9216 çipa individualë, duke i lejuar ata të funksionojnë si një superkompjuter i vetëm dhe i unifikuar. Themeli i këtij sistemi është një pëlhurë Inter-Chip Interconnect (ICI) me shpejtësi të lartë që ofron deri në 9,6 terabit për sekondë gjerësi brezi midis çipave, duke krijuar një topologji të dendur 3D Torus.

Ky rrjet u lejon çipave të aksesojnë një grup kolosal, të përbashkët prej 1,77 petabajte memorie të larta (dhe 1,7 petabytes me mini mm të lartë të të dhënave). pengesa që mund të gjymtojnë punë në shkallë të gjerë të AI.

Për të lidhur këto grupe çipash, Google përdor një rrjet dinamik të ndërprerësit optik (OCS). Kjo pëlhurë e rikonfigurueshme është çelësi si për shkallën ashtu edhe për elasticitetin.

Siç detajohet në përmbledhjen teknike të kompanisë, OCS mund të duke lidhur vetëm njësi të shëndetshme.

Google Ironwood TPU Architecture (Burimi që kjo punë e klientëve mund të zgjasë për javë të tëra, mund të zgjasë shumë javë për trajnimin e klientëve). toleranca është një veçori kritike që parandalon ndërprerjet e kushtueshme dhe maksimizon kohën produktive të funksionimit të të gjithë sistemit.

Në mënyrë thelbësore, ky harduer i avancuar është thellësisht i integruar me një grumbull softuerësh të bashkë-projektuar të ndërtuar mbi një filozofi të optimizimit të nivelit të sistemit. Në thelbin e tij është përpiluesi i Algjebrës Lineare të Përshpejtuar të Google (XLA), i cili përkthen kodin e nivelit të lartë nga kornizat e njohura si JAX dhe PyTorch në udhëzime makinerie shumë të optimizuara.

Përpiluesi është projektuar në mënyrë eksplicite për të synuar harduerin e specializuar të TPU-së, duke përfshirë të dendurin e tij Matrix (M Processing Un Process) (VPU). Duke bashkuar automatikisht operacionet në kernelet efikase, XLA ofron performancë të fuqishme”jashtë kutisë”.

Për konkluzion, kompania e ka optimizuar më tej grumbullin duke motorë si vLLM në Ironwood përmes një fundi të ri, të unifikuar, duke e bërë fuqinë e tij të pamasë më të aksesueshme për zhvilluesit që përdorin modele në prodhim.

Pushtimi i harduerit i Google është një komponent i një strategjie shumë më të madhe dhe shumëplanëshe të infrastrukturës.

Në raportet e fundit ne kemi theksuar disa nga planet strategjike të të dhënave të Australisë, nga qendra ambicioze e të dhënave të Ishullit Australi, AI-polit të Krishtlindjeve në Australi. Projekti’moonshot’Suncatcher, i cili synon të ndërtojë qendra të dhënash me fuqi TPU në hapësirë.

Iniciativat nxjerrin në pah burimet kolosale të nevojshme për të qëndruar në ballë të AI.

[përmbajtje e integruar]

Zgjerimi i Axion: Ridefinimi i përqendruesve me qëllime të përgjithshme AI, aplikacionet moderne kërkojnë një shtyllë të fuqishme dhe efikase për ngarkesat e përditshme të punës.

Google po e trajton këtë me një zgjerim të portofolit të tij të personalizuar të CPU-së Axion të bazuar në Arm. Kompania njoftoi se makinat e saj të reja virtuale N4A janë tani në vrojtim, së bashku me vrojtimin e ardhshëm të metalit C4A, shembujt e saj të parë metalikë të zhveshur të bazuara në krahë.

Të projektuar për të ofruar performancë më të lartë çmimi, këta procesorë trajtojnë detyrat me qëllime të përgjithshme që mbështesin aplikacionet e AI, duke përfshirë përgatitjen e të dhënave, shërbimin e kontejnerëve në ueb dhe mikroshërbimin. src=”https://winbuzzer.com/wp-content/uploads/2025/11/Google-Axion-CPU.jpg”width=”1280″height=”882″>CPU Google Axion (Burimi: Google)

Reagimet e hershme të klientit nxjerrin në pah përfitime të rëndësishme. Sergei Koren, arkitekti kryesor i infrastrukturës në ZoomInfo, vlerësoi rastet e reja, duke thënë:”Në vrojtimin tonë paraprak të rasteve të reja N4A, ne matëm një përmirësim prej 60% në performancën e çmimeve për këto ngarkesa kryesore të punës në krahasim me homologët e tyre të bazuar në x86.”

Në mënyrë të ngjashme, performanca transloading e saj, Vija core, përmirësoi performancën e saj30% krahasuar me VM-të e bazuara në x86.

Google po e pozicionon Axion si një alternativë të qartë dhe më efikase ndaj përpunuesve tradicionalë.

Sipas Mark Lohmeyer, VP dhe GM i AI dhe infrastrukturës kompjuterike në Google Cloud,”Ata do të kenë performancë 50% më të lartë se procesorët e krahasueshëm me efiçencë të krahasueshme x86 me gjenerim x86% dhe me efikasitet bazë të energjisë x86%. shembuj.”

Adoptions Strategic dhe Gara e Armëve me AI

Përkushtimi masiv i Anthropic shërben si një vërtetim i fuqishëm për silikonin e personalizuar të Google. Laboratori i AI, zhvilluesi i familjes së modeleve Claude, planifikon të aksesojë deri në 1 milion TPU, duke sinjalizuar besim të fortë në aftësitë e platformës si për trajnime ashtu edhe për konkluzione.

James Bradbury, Shefi i Llogaritjes së kompanisë, shpjegoi përfitimin:”Përmirësimet e Ironwood si në performancën e konkluzioneve ashtu edhe në shkallëzueshmërinë e trajnimit do të na ndihmojnë të shkallëzojmë me efikasitet duke ruajtur shpejtësinë dhe besueshmërinë që presin klientët tanë.”

Megjithatë, kjo marrëveshje e madhe ekziston brenda një realiteti kompleks, me shumë re. Ndërsa partneriteti është një fitore e rëndësishme për Google, raportet sqarojnë se Anthropic mban një strategji të larmishme infrastrukture, me shërbimet e Amazon Web që mbeten ofruesi kryesor i saj në renë kompjuterike.

Ai pasqyron një prirje më të gjerë të industrisë ku laboratorët kryesorë të AI po shmangin varësinë nga një shitës i vetëm, një strategji e parë më parë kur OpenAI filloi të përdorte Google Cloud për të plotësuar infrastrukturën e saj kryesore.

Gara e armatimeve me AI, përpjekjet e personalizuara të silikonit të Google synojnë drejtpërsëdrejti të sfidojnë dominimin e tregut të Nvidia. Kërkohen investime marramendëse për të konkurruar.

Për të përmbushur kërkesën në rritje, Google kohët e fundit e rriti parashikimin e fundit të shpenzimeve kapitale për vitin në 93 miliardë dollarë nga 85 miliardë dollarë.

Një angazhim i tillë i madh financiar tregon se kontrolli i harduerit themelor tani shihet si një përparësi kritike dhe efikase e posaçme ndaj PU-së, duke e çuar në mënyrë të veçantë avantazhin konkurrues.

CPU-të me qëllime të përgjithshme Axion, Google po prezanton një zgjidhje gjithëpërfshirëse, të bashkë-projektuar.

Kompania po vë bast që t’u ofrojë klientëve një grumbull hardueri të optimizuar dhe me kosto efektive, nga çipi te qendra e të dhënave, do të jetë çelësi për të fituar fazën tjetër të revolucionit të AI.

Categories: IT Info