A több billió paraméterrel rendelkező mesterséges intelligencia modellek betanítása érdekében a Microsoft november 13-án megerősítette, hogy egy kontinenst átfogó „AI szupergyárat” épít. A projekt a speciális adatközpontokat egyetlen virtuális szuperszámítógépbe kapcsolja össze. Ez a stratégia a helyi energia-és földterületi korlátok leküzdésére szolgál.
A nagy sebességű hálózat első csomópontja már online is működik, és összeköti a cég új „Fairwater” létesítményeit Wisconsinban és Atlantában, Georgia államban.
A Microsoft által a szükséges mesterséges intelligencia-infrastruktúra elosztásával a szükséges alapok százezreihez. a mesterséges intelligencia fejlesztésének következő hulláma, amely több államot hatékonyan egyetlen számítási erőforrásként kezel.

Ez a megközelítés közvetlenül megoldja az AI-infrastruktúra méretezésének elsődleges szűk keresztmetszeteit: elegendő földterületet és – ami még kritikusabb – megawatt teljesítményt biztosít egy helyen.
Az első kapcsolat, a 70-as távon keresztüli Wi-Fi kapcsolat működőképes, bizonyítva a koncepció életképességét. Ez a lépés az intenzív mesterséges intelligencia fegyverkezési verseny alapvető része, ahol a számítások vezérlése a legfontosabb.
Microsoft Atlanta Datacen (Kép: Microsoft)
Ez a stratégia lehetővé teszi, hogy a Microsoft olyan helyeken helyezze el az adatközpontokat, ahol kedvezőbbek a feltételek – például olcsóbb földterület, hűvösebb éghajlat vagy hozzáférés a megújuló energiához – anélkül, hogy feláldozná egyetlen épület teljesítményét. egy elosztott hálózat, amely virtuális szuperszámítógépként képes megbirkózni a világ legnagyobb kihívásaival oly módon, amit egyetlen létesítményben nem tudna megtenni” – mondta Alistair Speirs, a Microsoft Azure infrastruktúrára összpontosító vezérigazgatója egy vállalati bejelentés.
Microsoft Wisconsin Datacenter a Microsofton keresztül (Kép: Microsoft)
Ennek a víziónak a méretei, amelyek az egyetlen webhely modelljein túli, hatalmas jövőt igényelnek, mivel az AI nyújtani. „A mostani modellek betanításához szükséges infrastruktúra nem csupán egy adatközpont, nem kettő, hanem ennek a többszöröse” – magyarázta Mark Russinovich, a Microsoft Azure műszaki igazgatója.
Ez a házon belüli kiépítés a kettős stratégia egyik ágát képviseli, kiegészítve az olyan hatalmas kiszervezési ügyleteket, mint például a legutóbbi, 9,7 milliárd dolláros szerződés az IREN-nel a külső GPU-kapacitás biztosítására.
The Fair:h3 The Fairwater Archive Célra épített billió paraméterű modellekhez
Minden Fairwater létesítményen belül a Microsoft egy új architektúrát tervezett, amelyet kizárólag a nagyszabású AI-oktatáshoz optimalizáltak. Ezek nem hagyományos adatközpontok, amelyeket több millió különálló ügyfélalkalmazás futtatására terveztek.
Ehelyett arra tervezték őket, hogy egyetlen hatalmas, összetett feladatot hajtsanak végre az összes rendelkezésre álló hardveren. Maguk az épületek kétszintes kialakításúak, ami növeli a GPU-sűrűséget és csökkenti a jelek fizikai távolságát, minimálisra csökkentve a késleltetést.
A hardver és a létesítmények vertikális integrációja összhangban van a Microsoft szélesebb körű törekvésével a teljes mesterségesintelligencia-verem vezérlésére, beleértve a közelmúltban tett lépést az OpenAI egyedi hőkezelési lapkáinak licencelésére. közvetlenül chipre épített folyadékhűtő rendszer. A zárt hurkú kialakítás „majdnem nulla vizet” használ fel működése során, ami jelentős hatékonyságnövekedést jelent.
Atlantai telephelyén a Microsoft Nvid200 nagy teljesítményű rendszereket telepít7 GB22. mindegyik rack képes több mint 140 kilowatt húzására, és 72 GPU-t foglal magába.
Ezt az egész hardverkészletet a maximális teljesítményre tervezték, biztosítva, hogy ne kerüljön sor a komponensekre. „A mesterséges intelligencia terén való vezető szerep nem csupán több GPU hozzáadását jelenti – hanem az infrastruktúra kiépítését, amely lehetővé teszi, hogy egy rendszerként működjenek együtt” – mondta Scott Guthrie, a Microsoft felhő + mesterséges intelligencia részlegének ügyvezető alelnöke.
Kontinens méretű számítógép összefonása nagysebességű hálózattal
Századnyi adatot vezetünk be a latbatérésből a több száz milesparticonnecting3>
kihívásokkal, de ez a kulcs az új skála feloldásához. A Microsoft egy dedikált „AI Wide Area Network” (AI WAN) hálózatot épített ki e távolságok áthidalására.
Ez a privát gerinchálózat a lenyűgöző y/2″0perfactor,0″>y/2″0-superfactor. dedikált optikai kábel, amely biztosítja, hogy a mesterséges intelligencia képzési adatai ne versenyezzenek az általános internetes forgalommal.
A cél az, hogy a földrajzilag különálló helyek úgy viselkedjenek, mintha egyetlen épületben lennének, így a drága GPU-k folyamatosan használatban vannak.
Ehhez speciális, nagy sávszélességű hálózati hardverre van szükség, amely képes a teljesítmény fenntartására. szállító, az iparág számos hatékony megoldást készített erre a problémára. A Broadcom Jericho4 ASIC-jét például az ilyen típusú adatközpontok közötti adatközpontok közötti összeköttetéshez (DCI) tervezték.
„Ha egy képzési kapacitáson túl szeretnél növekedni mi vagyunk az egyetlen érvényes megoldás” – jegyezte meg Amir Sheffer, a Broadcom munkatársa.
Hasonlóan a Cisco is kifejlesztette 8223-as útválasztóját, hogy csatlakoztassa a Microsoft mesterséges intelligencia-adatközpontjait akár 1,5 kilométerre is0>. a technológia értékelője.
A friss jelentések hozzáteszik, hogy a belső hálózat kétszintű Ethernet-háttérrendszert használ, amely a Microsoft saját SONiC (Software for Open Networking in the Cloud) operációs rendszerét futtatja, 800 Gbps kapcsolatonkénti kapcsolattal.
Tekintettel a Microsoft és az Nvidia közötti mélyreható partnerségre, a GPU a Spectrum a GStender szövet az Nvidiához is erős. összeköti ezeket az oldalakat. Ez a több gyártóra kiterjedő hardvermegközelítés kritikus fontosságú a bezáródás elkerülése érdekében. Ezt a stratégiát a Microsoft az egész halomban követi, ideértve az Nvidia CUDA-szoftverének konkurens AMD chipjein való működését célzó erőfeszítéseket is.
A fizikai felépítés és az összeset összekötő összetett hálózat elsajátításával a Microsoft úgy pozicionálja magát, hogy irányítsa a mesterséges intelligencia következő fejlesztésének korszakát.