Meta rozpoczął testowanie swojego pierwszego zastrzeżonego układu szkoleniowego AI, oznaczając strategiczne dążenie do zmniejszenia polegania na NVIDIA i zwiększenie kontroli nad infrastrukturą AI.
Niestandardowy silikon, opracowany w ramach metalu w systemie META META TRINTION i PROCKELATOR (MTIA), jest częścią inicjatywy infrastruktury długoterminowej, a jego systemu AI, w tym projekty, w tym projekty. Modele Lamy.
Meta Road to zastrzeżone układy AI
Opracowane we współpracy z Tajwan Semiconductor Manufacturing Co. (TSMC), MTIA Chip MTIA niedawno zakończył fazę taśmową i jest teraz w ograniczonym wdrożeniu. href=”https://www.reuters.com/technology/artificial-intelligence/meta-beginins-testing-its-first-in-hous-truking-chip-2025-03-11/”> raporty Reuuters.
Zaprojektowany dla systemów wydajności energetycznej i optymalizowanej wydajności na Facebooku, wraz z planami programów treningowych AI. Aby rozszerzyć swoje zastosowanie do generatywnych narzędzi AI, w tym chatbotów, do 2026 r.
Decyzja Meta o rozwinięciu własnego krzemu pojawia się po wcześniejszych zmaganiach z niestandardowymi układami wnioskowania. Pomimo wcześniejszych wyzwań, dyrektorzy firmy uważają, że Chip Chip poprawi efektywność infrastruktury AI i ograniczy przyszły ryzyko łańcucha dostaw.
Trendy branżowe i strategie konkurencyjne
Inwestycje w właściwe sprzęt AI dostosowuje się do szerszego trendu branżowego. Openai rozwija własną niestandardową konstrukcję układów, zaplanowaną do produkcji z TSMC do 2026 r.
Zbudowany przy użyciu procesu 3-nanometru, układ Openai początkowo koncentruje się na zadaniach dotyczących wnioskowania, ostatecznie rozszerzając się na obciążenie treningowe.
Architektura oparta jest na projekcie tablicy skurczowej, która optymalizuje matrycę i obejmuje wysokie obciążenie. Szacowany koszt rozwoju tej początkowej iteracji wynosi 500 milionów dolarów.
Amazon Web Services (AWS) realizuje strategię równoległej z serią Trainium Chip. Trainium2, wprowadzony na rynek w grudniu 2024 r., Dostarcza do 20,8 Petaflops gęstego obliczenia FP8 na instancję i wykorzystuje interkonekt neuronlink AWS do transmisji danych o niskiej opóźnieniu. AWS twierdzi, że Trainium3, oczekiwany pod koniec 2025 r., Oferuje czterokrotny wzrost wydajności w stosunku do swojego poprzednika (źródło).
Apple stosuje podejście hybrydowe, łącząc rozwój wewnętrzny z partnerstwami zewnętrznymi. Posuwając własny układ serwera „Baltra”, Apple wykorzystuje również układy AWS Trainium2 do modelu AI pretraining.
dominacja NVIDIA stoi przed dominacją nowej konkurencji
nvidia nadal utrzymuje konstrukcję dominującą. Koszty eskalacyjne pchają firmy, takie jak Meta w kierunku niestandardowych alternatyw.
W 2024 r. Microsoft stał się największym klientem NVIDIA, nabywając 485 000 układów AI, podkreślając intensywną konkurencję dla zaawansowanej sporady. Rozwiązania.
Wraz ze wzrostem złożoności modeli AI, niestandardowy krzem zapewnia firmom takim jak Meta możliwość dostosowywania infrastruktury do określonych obciążeń, poprawiając w ten sposób wydajność treningu i zmniejszając wąskie gardła.
techniczne wyzwania związane z niestandardowym rozwojem chipów
. Szacowany koszt rozwoju Openai w wysokości 500 milionów dolarów na początkową iterację chipów podkreśla zaangażowane stawki finansowe.
Faza taśmowa, w której ostateczne projekty układów są przekazywane do produkcji, przedstawia kolejną warstwę ryzyka. Błędy na tym etapie mogą prowadzić do opóźnień kilku miesięcy i milionów dodatkowych kosztów.
Dynamika geopolityczna dodatkowo komplikują te wysiłki. Zarówno Meta, jak i Openai polegają na TSMC w celu produkcji, wiążąc swoje strategie sprzętowe z możliwościami produkcji półprzewodnikowej Tajwanu.
Tymczasem ograniczenia eksportowe w USA na zaawansowanych układach dodają kolejną warstwę złożoności, wpływając na sposób, w jaki firmy źródła i skalą ich operacje sprzętu. To sprawia, że rozwój odpornych i zróżnicowanych łańcuchów dostaw krytyczny dla długoterminowego sukcesu. Z drugiej strony
Apple zabezpiecza infrastrukturę AI poprzez inwestycje krajowe. Ostatnie zobowiązanie firmy w wysokości 500 miliardów dolarów w amerykańskich operacjach półprzewodnikowych opiera się na korzystnych koncesjach dotyczących polityki, w tym ulgach podatkowych i subsydiach związanych z ustawą o układach.
Strategiczne implikacje dla rozwoju AI
Meta w kierunku nieruchomości jest więcej niż próba zarządzania kosztami; Jest to strategiczny ruch w celu zapewnienia długoterminowej kontroli nad infrastrukturą AI. Ponieważ modele AI stają się coraz bardziej złożone, zdolność do skalowania i optymalizacji infrastruktury staje się kluczowym wyróżnikiem.
Wewnętrzne rozwój chipów Meta ma na celu sprostanie tym wyzwaniom, zapewniając, że firma może dostosować swoją infrastrukturę, aby pasowały do rosnących wymagań związanych z inicjatywami AI.
Niestandardowy krzemion zapewnia również korzyści wydajnościowe, które są trudne do osiągnięcia. Dostosowanie układów do konkretnych wymagań dużych modeli AI pozwala metai na zmniejszenie opóźnienia przetwarzania, poprawę przepustowości i optymalizacji efektywności energetycznej.
Może to być szczególnie korzystne dla przyspieszenia szkolenia i wdrażania modeli, takich jak jego serie LAMA, w których szybsze wytwarzanie tokenów i niższe czasy wnioskowania są krytyczne dla pozycjonowania konkurencyjnego. W miarę postępu technologii.
W miarę ewolucji obciążeń AI, firmy, które kontrolują zarówno warstwy sprzętowe, jak i oprogramowania, będą lepiej przygotowane w celu wydajności wydajności i skalowania. Inwestycja Meta w niestandardowe układy są krokiem w kierunku zapewnienia tego poziomu kontroli.
Szerszy wpływ czynników geopolitycznych i politycznych
Globalne łańcuchy dostaw dla sprzętu AI jest coraz większy wpływ dynamiki geopolitycznej. Firmy zależne od tajwańskiej produkcji, takich jak meta i Openai, napotykają potencjalną ekspozycję na niestabilność regionalną i ograniczenia eksportowe.
U.S. Rządowe kontrole zaawansowanego eksportu ChIP to kolejny punkt nacisku, kształtujący sposób, w jaki firmy podchodzą do strategii infrastruktury długoterminowej. Ryzyko te podkreśla wartość zabezpieczania różnorodnych i odpornych łańcuchów dostaw, strategii, którą wewnętrzny rozwój chipów Meta bezpośrednio obsługuje.
Inwestycje krajowe Apple podkreślają inną ścieżkę. Zobowiązanie firmy w wysokości 500 miliardów dolarów na amerykańskie operacje półprzewodników nie dotyczy nie tylko zdolności produkcyjnych, ale także minimalizacji ryzyka geopolitycznego i dostosowania się do ewoluujących ram polityki.
To podejście stanowi model, w jaki sposób inwestycje sprzętowe na dużą skalę mogą poruszać się w krajobrazach regulacyjnych i politycznych, aby zapewnić stabilność infrastruktury.