Apple przyspiesza realizację swoich ambicji związanych ze sztuczną inteligencją (AI), integrując chipy AWS Trainium2 ze swoimi procesami wstępnego szkolenia AI.
Podczas konferencji AWS re:Invent, która odbyła się 4 grudnia, Benoit Dupin, starszy dyrektor ds. maszyn w Apple uczenie się i sztuczna inteligencja, omówiono wczesne oceny firmy dotyczące sprzętu AWS. „Na wczesnych etapach oceniania Trainium2 spodziewamy się nawet 50% poprawy wydajności po treningu wstępnym” – powiedział Dupin publiczności podczas krótkiego wystąpienia na scenie.
Partnerstwo podkreśla pogłębiające się relacje między Apple i AWS, przy czym technologiczny gigant polega na serwerach UltraServers opartych na Trainium2 w celu skalowania swoich operacji AI przy jednoczesnej optymalizacji wydajności i kosztów.
Apple i AWS mają charakter długoterminowy Partnerzy
Korzystanie przez Apple z infrastruktury AWS nie jest niczym nowym. Firma od dawna wykorzystuje chipy AWS, takie jak Graviton i Inferentia dekadę na wspieranie kluczowych produktów i usług, w tym Siri, Apple Maps i Apple Music.
Zdolność AWS do obsługi obciążeń AI na dużą skalę uczyniła z niego kluczowego partnera Apple, jak to ujął Dupin: „. Mamy silne relacje, a infrastruktura jest niezawodna i zdolna do obsługi naszych klientów na całym świecie.”
Dodanie Trainium2 do zestawu narzędzi Apple AI odzwierciedla zaangażowanie obu firm w przesuwanie granic wydajności sztucznej inteligencji i skalowalność.
Chipy Trainium2 i UltraServery: spełnienie potrzeb współczesnej sztucznej inteligencji
AWS wprowadziło wczoraj na rynek chipy Trainium2 i UltraServery Trn2, co stanowi kamień milowy w dziedzinie sztucznej inteligencji rozwój sprzętu. Chipy Trainium2 zapewniają do 20,8 petaflopów gęstych obliczeń FP8 na instancję i są zaprojektowane tak, aby sprostać rosnącym wymaganiom obliczeniowym modeli AI o bilionach parametrów.
Serwery Trn2 UltraServers, wyposażone w 64 chipy Trainium2, osiągają do 83,2 petaflopów o skąpej wydajności 8PR. Jest to możliwe dzięki opatentowanemu przez AWS interkonektowi NeuronLink, który zapewnia komunikację o małych opóźnieniach i dużej przepustowości w systemach rozproszonych.
David Brown, wiceprezes AWS ds. obliczeń i sieci, podkreślił transformacyjny potencjał Trainium2: „ Trainium2 to najwydajniejszy chip AWS stworzony do tej pory. A ponieważ modele zbliżały się do bilionów parametrów, wiedzieliśmy, że klienci będą potrzebować nowatorskiego podejścia do uczenia i uruchamiania tych ogromnych modeli.”
AWS zademonstrował możliwości Trainium2, uruchamiając model Lama 405B firmy Meta, osiągając trzykrotnie większą generację tokenów przepustowość w porównaniu z konkurencyjnymi ofertami innych dostawców usług w chmurze. To przełomowe rozwiązanie zaspokaja krytyczną potrzebę szybszego generowania tekstu, podsumowań i wnioskowania w czasie rzeczywistym.
Apple Intelligence i Multi-Cloud. Podejście
Strategia firmy Apple dotycząca sztucznej inteligencji opiera się na platformie generatywnej sztucznej inteligencji Apple Intelligence, która obsługuje takie funkcje, jak przetwarzanie języka naturalnego w Siri, zaawansowane podsumowania powiadomień i kreatywne narzędzia, takie jak generowanie emoji.
Apple Intelligence działa w modelu hybrydowym, wykorzystując obliczenia na urządzeniu za pośrednictwem chipów z serii M, aby zapewnić prywatność i wydajność, jednocześnie opierając się na infrastrukturze chmury w przypadku złożonych obciążeń.
To rozwiązanie Podejście wielochmurowe obejmuje zarówno AWS, jak i Google Cloud. Na początku tego roku Apple potwierdził, że wykorzystuje chipy Google TPU do szkolenia komponentów Apple Intelligence. Ta zróżnicowana strategia pozwala Apple optymalizować określone obciążenia w oparciu o mocne strony każdej platformy.
Dzięki Trainium2 platforma AWS stanowi opłacalną alternatywę dla procesorów graficznych Nvidia, umożliwiając Apple skalowanie operacji AI bez utraty wydajności.
Powiązane: Zmiany w sztucznej inteligencji Apple Siri przesunięte na rok 2026, ponieważ liderem jest Google Gemini
Projekt Rainier: Współpraca AWS z Anthropic
Szersze ambicje AWS w zakresie sztucznej inteligencji obejmują projekt Rainier, partnerstwo z Anthropic w celu opracowania jednego z największych na świecie klastrów obliczeniowych AI. Projekt Rainier, wyposażony w tysiące chipów Trainium2, został zaprojektowany w celu zapewnienia niespotykanej dotąd skalowalności dla generatywnej sztucznej inteligencji.
Anthropic, firma stojąca za modelem języka Claude 3.5 Sonnet, planuje wykorzystać klaster do pięciokrotnego skalowania swojego uczenia modelu. Inwestycja AWS w Anthropic, która obecnie wynosi 8 miliardów dolarów, podkreśla jej zaangażowanie we wspieranie innowacji w infrastrukturze sztucznej inteligencji.
Wspierając zarówno Apple, jak i Anthropic, AWS demonstruje swoją zdolność do obsługi różnorodnych obciążeń związanych ze sztuczną inteligencją, od szkoleń wstępnych po rzeczywiste-wnioskowanie w czasie.
AWS Trainium3 i przyszłość sprzętu AI
AWS już patrzy w przyszłość na swój chip nowej generacji, Trainium3, którego premiera planowana jest na koniec 2025 r., Trainium3, zbudowane w procesie trzynanometrowym, zapewnia czterokrotną poprawę wydajności w porównaniu z Trainium2. Rozwój ten umożliwi jeszcze większe modele sztucznej inteligencji i krótsze czasy szkolenia, wzmacniając pozycję AWS jako lidera w dziedzinie sprzętu AI.
Ultracluster, superkomputer oparty na Trainium3, jeszcze bardziej zwiększy możliwości AWS. AWS opisuje go jako największy na świecie klaster obliczeniowy AI, zdolny do obsługi modeli o bilionach parametrów z niezrównaną wydajnością.
Te udoskonalenia odzwierciedlają strategiczną wizję AWS mającą na celu zakwestionowanie dominacji Nvidii na rynku sprzętu AI, oferując przedsiębiorstwom takim jak Apple i Antropiczne, opłacalne, skalowalne rozwiązania dostosowane do ich potrzeb.
Przejście w branży w kierunku niestandardowego krzemu
Wdrożenie przez Apple chipów AWS Trainium2 wpisuje się w szerszy trend branżowy w kierunku niestandardowych układów krzemowych do zastosowań związanych ze sztuczną inteligencją. Firmy coraz częściej odchodzą od tradycyjnych rozwiązań opartych na procesorach graficznych na rzecz sprzętu zaprojektowanego specjalnie dla aplikacji AI.
Zintegrowane podejście AWS, łączące sprzęt taki jak Trainium2 z narzędziami takimi jak Neuron SDK, pozycjonuje go jako realną alternatywę do Nvidii. Inwestując w niestandardowy krzem, Apple i AWS stymulują innowacje w infrastrukturze sztucznej inteligencji, torując drogę dla bardziej wydajnych i skalowalnych rozwiązań.