Microsoft vahvisti 13. marraskuuta rakentavansa mantereen kattavaa”AI-supertehdasta”kouluttaakseen biljoonia parametreja sisältäviä tekoälymalleja. Projekti yhdistää erikoistuneet tietokeskukset yhdeksi virtuaaliseksi supertietokoneeksi. Strategia on suunniteltu paikallisten teho-ja maarajoitusten voittamiseksi.

Tämän nopean verkon ensimmäinen solmu on nyt verkossa, ja se yhdistää yrityksen uudet Fairwater-tilat Wisconsinissa ja Atlantassa, Georgiassa.

Jakamalla Microsoftin tavoitteet valtavat AI-infrastruktuurit luovat perustan satojen tekoälyjen kautta. seuraava tekoälyn kehitysaalto, joka käsittelee useita tiloja tehokkaasti yhtenä laskentaresurssina.

Tekoälyn supertehdas, joka kattaa osavaltioita

Microsoftin kunnianhimoinen projekti määrittelee uudelleen datakeskuksen kampuksen käsitteen. Sen sijaan, että keskittäisi kaiken laskentansa yhdelle maantieteelliselle alueelle, yritys luo hajautetun verkon, joka toimii yhtenä yhtenäisenä koneena.

Tämä lähestymistapa ratkaisee suoraan AI-infrastruktuurin skaalauksen ensisijaiset pullonkaulat: riittävän maa-alueen ja, mikä kriittisemmin, megawatin tehon turvaaminen yhdestä paikasta.

Ensimmäinen yhteys, 70 mailin etäisyys Atlanttiin ja nyt 0,0-miljoonaa. toimivaksi, mikä osoittaa konseptin elinkelpoisuuden. Tämä siirto on keskeinen osa intensiivistä tekoälyn asevarustelukilpailua, jossa laskennan ohjaaminen on ensiarvoisen tärkeää.

Microsoft Atlanta Datacen (Kuva: Microsoft)

Tämän strategian avulla Microsoft voi sijoittaa palvelinkeskuksia suotuisampiin olosuhteisiin – kuten halvempi maa, viileämpi ilmasto tai uusiutuvan energian saatavuus – tinkimättä yhden rakennuksen tehokkuudesta. hajautettu verkko, joka voi toimia virtuaalisena supertietokoneena, joka vastaa maailman suurimpiin haasteisiin tavoilla, joita et vain pystyisi tekemään yhdessä laitoksessa”, sanoi Alistair Speirs, Azure-infrastruktuuriin keskittyvä Microsoftin toimitusjohtaja yritysilmoitus.

Microsoft Wisconsin Datacenter Microsoftin kautta (Kuva: Microsoft)

Tämän vision mittakaava on valtava, sillä yritys uskoo, että tulevat tekoälymallit vaativat paljon enemmän laskentatehoa kuin yksittäinen sivusto pystyy tarjoamaan.”Näiden mallien kouluttamiseen tarvitaan nyt infrastruktuurin määrä, joka ei ole vain yksi palvelinkeskus, ei kaksi, vaan sen moninkertainen määrä”, selitti Microsoft Azure-teknologiajohtaja Mark Russinovich.

Tämä talon sisäinen rakennelma edustaa kahta strategiaa, joka täydentää massiivisia ulkoistussopimuksia, kuten äskettäinen 9,7 miljardin dollarin sopimus IRENin kanssa ulkoisen grafiikkasuorittimen kapasiteetin turvaamiseksi.

The Fairh3>The Fair:h3. Rakennettu biljoonaparametriisille malleille

Microsoft on kehittänyt jokaiseen Fairwater-laitokseen uuden arkkitehtuurin, joka on optimoitu yksinomaan laajamittaiseen tekoälykoulutukseen. Nämä eivät ole perinteisiä palvelinkeskuksia, jotka on suunniteltu suorittamaan miljoonia erillisiä asiakassovelluksia.

Sen sijaan ne on suunniteltu suorittamaan yksi massiivinen, monimutkainen työ kaikilla saatavilla olevilla laitteilla. Itse rakennuksissa on kaksikerroksinen suunnittelu, valinta, joka lisää GPU-tiheyttä ja vähentää fyysistä etäisyyttä, jonka signaalien on kuljettava, minimoiden latenssin.

Tämä laitteiston ja tilojen vertikaalinen integrointi on linjassa Microsoftin laajemman työn kanssa hallita koko tekoälypinoaan, mukaan lukien äskettäinen siirtyminen OpenAI:n mukautettujen lämpösirujen lisensoimiseen.

Tämä tiheys luo edistysaskeleita. suoraan sirulle nestejäähdytysjärjestelmä. Suljetun kierron suunnittelu kuluttaa “lähes nollaa vettä”toiminnassaan, mikä on merkittävä tehokkuuden lisäys.

Atlanta-sivustollaan Nvidia’s ottaa käyttöön tehokkaat N2-järjestelmät2 GB20. jokainen teline pystyy lataamaan yli 140 kilowattia ja sisältää 72 GPU:ta.

Tästä koko laitteistopinosta tulee maksimaalista suorituskykyä, mikä varmistaa, ettei komponentteja ole.”Tekoälyn johtaminen ei tarkoita vain grafiikkasuorittimien lisäämistä – se on infrastruktuurin rakentamista, joka saa ne toimimaan yhdessä yhtenä järjestelmänä”, totesi Scott Guthrie, Microsoftin Cloud + AI-osaston varatoimitusjohtaja.

Maanosan kokoisen tietokoneen yhdistäminen nopealla verkkoyhteydellä

esittelee merkittäviä satoja latvaustietoja milespartersConnect3>

haasteita, mutta se on avain tämän uuden mittakaavan avaamiseen. Microsoft on rakentanut erillisen”AI Wide Area Networkin”(AI WAN) näiden etäisyyksien ylittämiseksi.

Tämä yksityinen runkoverkko on rakennettu hämmästyttävän y/2″0perfactor,0″>y/2″0 omistettu kuituoptinen kaapeli, joka varmistaa, että tekoälyn harjoitustiedot eivät kilpaile yleisen Internet-liikenteen kanssa.

Tavoitteena on saada maantieteellisesti erilliset sivustot käyttäytymään ikään kuin ne olisivat samassa rakennuksessa, jolloin kalliit grafiikkasuorittimet pysyvät jatkuvasti käytössä.

Tämä vaatii erikoistunutta, laajakaistaverkkolaitteistoa, joka pystyy ylläpitämään suorituskykyä. myyjä, teollisuus on tuottanut useita tehokkaita ratkaisuja juuri tähän ongelmaan. Esimerkiksi Broadcomin Jericho4 ASIC on suunniteltu tämän tyyppisille tietokeskusten välisille tietokeskuksille (DCI).

“Jos haluat kasvattaa yhden harjoittelun kapasiteettia, niin olemme ainoa oikea ratkaisu”, totesi Broadcomin Amir Sheffer.

Samaan tapaan Cisco on kehittänyt 8223-reitittimensä yhdistääkseen Microsoftin tekoälyn palvelinkeskuksia 0-00 kilometriin asti 1,00 kilometriin asti. tekniikan arvioija.

Tuoreet raportit lisäävät, että sisäinen verkko käyttää kaksitasoista Ethernet-taustajärjestelmää, jossa on Microsoftin oma SONiC (Software for Open Networking in the Cloud)-käyttöjärjestelmä ja 800 Gbps:n yhteys linkkiä kohden.

Koska Microsoftin syvä kumppanuus Nvidian kanssa, GPU on myös vahva contrum g-GStender-alusta Nvidian kanssa. yhdistää nämä sivustot. Tämä usean toimittajan laitteiston lähestymistapa on kriittinen välttääkseen lukkiutumisen, strategiaa, jota Microsoft noudattaa kaikissa pinoissaan, mukaan lukien pyrkimykset saada Nvidian CUDA-ohjelmisto toimimaan kilpailevien AMD-sirujen kanssa.

Hallitsemalla sekä fyysisen rakenteen että kaiken yhdistävän monimutkaisen verkkoyhteyden Microsoft asemoi hallitsemaan tekoälyn peruskerrosta seuraavaa kehitystä varten.