Për të trajnuar modele të inteligjencës artificiale me triliona parametra, Microsoft konfirmoi më 13 nëntor se po ndërton një”superfabrika të AI”në të gjithë kontinentin. Projekti lidh qendrat e specializuara të të dhënave në një superkompjuter të vetëm virtual, një strategji e projektuar për të kapërcyer kufizimet e fuqisë lokale dhe tokës.
Nyja e parë në këtë rrjet me shpejtësi të lartë është tani në linjë, duke lidhur objektet e reja”Fairwater”të kompanisë në Wisconsin dhe Atlanta, Georgia.
Duke krijuar qindra milje të infrastrukturave të nevojshme të inteligjencës artificiale të Microsoft në ngarkesat e tjera të punës, të gjetura në qindra milje të inteligjencës artificiale në ngarkesat e tjera të punës. vala e zhvillimit të inteligjencës artificiale, duke trajtuar në mënyrë efektive gjendje të shumta si një burim i vetëm llogaritës.
Një”Superfactory AI”që përfshin Shtetet
Projekti ambicioz i Microsoft ripërcakton konceptin e një kampusi të qendrës së të dhënave. Në vend që të përqendrojë të gjithë llogaritë e saj në një zonë gjeografike, kompania po krijon një rrjet të shpërndarë që funksionon si një makinë kohezive.
Kjo qasje trajton drejtpërdrejt pengesat kryesore në shkallëzimin e infrastrukturës së AI: sigurimin e mjaftueshëm të tokës dhe, më kritike, megavat energji në një vend.
Lidhja e parë në distancë, në lidhje me Wi-Tamil0,0,0,0,00 tani është funksionale, duke dëshmuar qëndrueshmërinë e konceptit. Kjo lëvizje është një pjesë thelbësore e garës intensive të armatimit të AI, ku kontrolli i llogaritjes është parësor.
Microsoft Atlanta Datacen (Image: Microsoft)
Kjo strategji i lejon Microsoft-it të vendosë qendrat e të dhënave në vende me kushte më të favorshme—si tokë më e lirë, klima më të freskëta ose akses në energjinë e rinovueshme—pa sakrifikuar performancën e vetme>“të vetme. ka të bëjë me ndërtimin e një rrjeti të shpërndarë që mund të veprojë si një superkompjuter virtual për të trajtuar sfidat më të mëdha të botës në mënyra që thjesht nuk mund t’i bënit në një strukturë të vetme,”tha Alistair Speirs, një menaxher i përgjithshëm në Microsoft i fokusuar në infrastrukturën Azure, në një njoftim kompanie.
Microsoft Qendra e të dhënave në Wisconsin nëpërmjet Microsoft (Image: Microsoft)
Shkalla e këtij vizioni është e madhe, pasi kompania beson se modelet e ardhshme të AI do të kërkojnë fuqi llogaritëse shumë më tepër se çfarë mund të ofrojë çdo sajt i vetëm.”Sasia e infrastrukturës që kërkohet tani për të trajnuar këto modele nuk është vetëm një qendër të dhënash, jo dy, por shumëfish të saj,”shpjegoi CTO i Microsoft Azure, Mark Russinovich.
Ky ndërtim i brendshëm përfaqëson një degë të një strategjie të dyfishtë, duke plotësuar marrëveshjet masive të kontraktimit të jashtëm, si kontrata e fundit prej 9.7 miliardë dollarësh me IREN: Kapaciteti i jashtëm 9.7 miliardë dollarësh me IREN. E krijuar me qëllim për modele me trilion parametra
Brenda çdo objekti Fairwater, Microsoft ka krijuar një arkitekturë të re të optimizuar ekskluzivisht për trajnime të AI në shkallë të gjerë. Këto nuk janë qendra të dhënash tradicionale të krijuara për të ekzekutuar miliona aplikacione të veçanta të klientëve.
Në vend të kësaj, ato janë ndërtuar me qëllim për të ekzekutuar një punë masive, komplekse në të gjithë harduerin e disponueshëm. Vetë ndërtesat kanë një dizajn dykatësh, një zgjedhje që rrit densitetin e GPU-së dhe redukton sinjalet e distancës fizike që duhet të udhëtojnë, duke minimizuar vonesën.
Ky integrim vertikal i pajisjeve dhe pajisjeve përputhet me shtytjen më të gjerë të Microsoft për të kontrolluar të gjithë grupin e tij të AI, duke përfshirë lëvizjen e tij të fundit për të licencuar dizajnet e personalizuara të çipave të OpenAI-t.
Sistemi i ftohjes së lëngshme direkt në çip. Dizajni me qark të mbyllur konsumon “pothuajse zero ujë”në operacionet e tij, një rritje e konsiderueshme e efikasitetit.
Microsoft do të përdorë NJP të fuqishme në sajtet e saj GBlan20 në sajtet e saj të fuqishme GBlan0. Sistemet e rafteve NVL72, me çdo raft të aftë për të tërhequr mbi 140 kilovat dhe strehojnë 72 GPU.
Ky komponent nuk është i kompletuar në maksimum për performancën e motorit. ngushtica. “Lideri në AI nuk ka të bëjë vetëm me shtimin e më shumë GPU-ve – ka të bëjë me ndërtimin e infrastrukturës që i bën ata të punojnë së bashku si një sistem,” tha Scott Guthrie, nënkryetar ekzekutiv i Microsoft për Cloud + AI.
Gërja e një kompjuteri me madhësi kontinenti me rrjetëzim me shpejtësi të lartë
Kjo shtyllë private është ndërtuar mbi një 120,000 milje kabllo të re, të dedikuar me fibër optike, duke siguruar që të dhënat e trajnimit të AI të mos konkurrojnë me trafikun e përgjithshëm të internetit.
Qëllimi është që faqet gjeografikisht të ndara të sillen sikur të ishin në një ndërtesë të vetme, duke mbajtur GPU-të e shtrenjta të përdorura vazhdimisht, të përdorura vazhdimisht nga softueri me brez të lartë, i cili kërkon softuer të veçantë.
duke ruajtur performancën në distanca të mëdha.
Ndërsa Microsoft nuk e ka emëruar zyrtarisht shitësin e tij, industria ka prodhuar disa zgjidhje të fuqishme për këtë problem. Jericho4 ASIC i Broadcom, për shembull, është projektuar për këtë lloj trajnimi ndërlidhje nga qendra e të dhënave në qendrën e të dhënave (DCI).
ju dua të rritni kapacitetin tuaj dhe të clu’re>. një ndërtesë e vetme, ne jemi e vetmja zgjidhje e vlefshme atje,”vuri në dukje Amir Sheffer i Broadcom.
Në mënyrë të ngjashme, Cisco ka zhvilluar ruterin e saj 8223 për të target=”_blank data”>. përveç, me Microsoft të quajtur si një vlerësues i hershëm i teknologjisë.
Raportimi i ri shton se rrjeti i brendshëm përdor një sistem mbështetës Ethernet me dy nivele që drejton sistemin operativ SONiC (Softuer për rrjete të hapura në renë kompjuterike) të Microsoft-it, me lidhje 800 Gbps për lidhje.
Partneriteti i thellë i Microsoft-it, Ndia Given, Givenant Given’ndia’s thelluar me Microsoft. Platforma Spectrum-XGS është gjithashtu një pretendent i fortë për pëlhurën që lidh këto vende. Kjo qasje harduerike me shumë shitës është kritike për shmangien e bllokimit, një strategji që Microsoft po ndjek në të gjithë grupin e saj, duke përfshirë përpjekjet për ta bërë softuerin CUDA të Nvidia të funksionojë në çipat konkurrues AMD.
Duke zotëruar si ndërtimin fizik ashtu edhe rrjetin kompleks që i lidh të gjitha së bashku, Microsoft po pozicionohet për të kontrolluar shtresën e ardhshme bazë të zhvillimit AI.