Start Elona Muska zajmujący się sztuczną inteligencją, xAI, przyspiesza rozwój „modeli świata” symulujących rzeczywistość, zatrudniając kluczowych ekspertów z giganta chipów Nvidia.
Według raporty firma zatrudniła latem badaczy sztucznej inteligencji Zeeshana Patela i Ethana He, sygnalizując bezpośrednie wyzwanie dla liderów branży w obliczu kolejnego dużego wyścigu zbrojeń w zakresie sztucznej inteligencji.
To strategiczne działanie podkreśla rosnące znaczenie modeli światowych — zaawansowanej sztucznej inteligencji, która potrafi rozumieć i przewidywać środowiska fizyczne. Dla Muska i jego rywali opanowanie tej technologii to kluczowy krok w kierunku stworzenia bardziej wydajnej sztucznej inteligencji na potrzeby robotyki, gier i ostatecznie sztucznej inteligencji ogólnej (AGI).
To posunięcie pogłębia również więzi między obiema firmami. Nvidia to nie tylko źródło talentów, ale także potwierdzony inwestor w xAI, co niedawno potwierdził dyrektor generalny Jensen Huang. Sojusz ten podkreśla ogromne zasoby obliczeniowe wymagane do zbudowania tych wyrafinowanych modeli.
xAI wkracza do walki dzięki talentom i inwestycjom Nvidia
Chociaż xAI jest znane ze swojego chatbota Grok, ta nowa inicjatywa oznacza znaczącą ekspansję poza modele językowe. Zatrudnianie talentów przez firmę Nvidia, lidera symulacji wykorzystującą platformę Omniverse, jest wyraźnym oświadczeniem zamiaru zbudowania sztucznej inteligencji, która rozumie przestrzeń 3D i wchodzi z nią w interakcję, a nie tylko tekst.
Ambicje xAI nie są czysto akademickie. Musk publicznie oświadczył, że celem firmy jest wypuszczenie „wspaniałej gry generowanej przez sztuczną inteligencję przed końcem przyszłego roku”. Ten agresywny harmonogram sugeruje, że xAI koncentruje się na przełożeniu najnowocześniejszych badań na namacalne produkty, co może potencjalnie zakłócić branżę rozrywki interaktywnej.
Aby to osiągnąć, firma buduje „zespół omni” skupiony na systemach sztucznej inteligencji, które potrafią rozumieć i generować treści w różnych formatach, w tym zdjęcia, filmy i dźwięk. Rekrutacja Patela, którego praca koncentruje się na modelach generatywnych i wizji 3D, bezpośrednio wpisuje się w tę multimodalną strategię.
Czym są modele świata i dlaczego mają znaczenie?
Modele świata stanowią zasadniczą zmianę w rozwoju sztucznej inteligencji. Zamiast po prostu przetwarzać dane, budują wewnętrzną symulację rzeczywistości, która pozwala im przewidzieć, jak będą przebiegać działania w przestrzeni fizycznej. Zdolność ta jest postrzegana jako kamień węgielny przyszłości sztucznej inteligencji.
W przeciwieństwie do tradycyjnych silników fizycznych, które opierają się na zakodowanych na stałe regułach, modele te uczą się intuicyjnego rozumienia rzeczywistości poprzez analizę ogromnych ilości danych wideo. Jak wyjaśnił Juan Bernabé-Moreno, dyrektor IBM Research: „Modele świata pozwalają maszynom planować ruchy i interakcje w symulowanych przestrzeniach, często nazywanych „cyfrowymi bliźniakami”, przed wypróbowaniem ich w świecie fizycznym”.
To podejście oparte na „cyfrowym bliźniaku” pozwala sztucznej inteligencji uczyć się metodą prób i błędów w bezpiecznym środowisku wirtualnym, co radykalnie przyspiesza szkolenie w zakresie zadań takich jak robotyka i autonomiczna nawigacja.
Dlatego wielu specjalistów w tej dziedzinie uważa, że modele świata są niezbędne do osiągnięcia AGI. Jack Parker-Holder, pracownik naukowy w DeepMind, podkreślił tę kwestię, stwierdzając: „uważamy, że modele świata są kluczowe na drodze do AGI, szczególnie w przypadku agentów wcielonych, gdzie symulowanie scenariuszy ze świata rzeczywistego jest szczególnie trudne”.
Zatłoczone pole: globalny wyścig w celu symulacji rzeczywistości
xAI wkracza na arenę wysoce konkurencyjną. Google DeepMind odegrał dominującą rolę, formalnie powołując na początku 2025 r. zespół zajmujący się modelami świata. Lider zespołu, Tim Brooks, ogłosił, że „DeepMind ma ambitne plany stworzenia ogromnych modeli generatywnych symulujących świat”, co sygnalizuje znaczące zaangażowanie firmy.
Technologia DeepMind szybko ewoluowała. Wczesny model Genie 2, wypuszczony na rynek pod koniec 2024 r., był w stanie wytrzymać symulacje tylko przez około 20 sekund. Jego następca, Genie 3, zaprezentowany w sierpniu 2025 r., stanowi ogromny krok naprzód, ponieważ generuje interaktywne światy 3D na kilka minut, a nawet umożliwia wprowadzanie zmian w czasie rzeczywistym za pomocą komunikatów tekstowych.
Meta również przedstawiła swoje roszczenia, przedstawiając V-JEPA 2, model o otwartym kodzie źródłowym, zaprojektowany tak, aby zapewnić robotom zdrowy rozsądek poprzez uczenie się z wideo. Tymczasem chiński gigant technologiczny Tencent wypuścił HunyuanWorld-Voyager, który może tworzyć eksploracyjne światy 3D z jednego obrazu i wykazał się dobrą wydajnością w branżowych testach porównawczych.
Droga przed nami: od ambitnych badań do wpływu w świecie rzeczywistym
Pomimo szybkiego postępu technologia jest wciąż na wczesnym etapie. Naukowcy przyznają, że zanim możliwe będzie niezawodne wdrożenie tych modeli, nadal istnieją znaczne przeszkody. Kluczowe wyzwania obejmują wydłużenie czasu trwania symulacji i zapewnienie, że działania sztucznej inteligencji są fizycznie dokładne i bezpieczne.
Obecne modele borykają się również z określonymi zadaniami, takimi jak dokładne renderowanie tekstu lub symulowanie złożonych interakcji między wieloma niezależnymi agentami. Shlomi Fruchter, dyrektor ds. badań w Google DeepMind, przestrzegła, że „jest wiele rzeczy, które muszą się wydarzyć, zanim model będzie można wdrożyć w prawdziwym świecie, ale postrzegamy to jako sposób na skuteczniejsze uczenie modeli i zwiększanie ich niezawodności”.
Tworzenie modeli światowych to maraton, a nie sprint. Wymaga to ogromnych inwestycji w talent, dane i moc obliczeniową. Dzięki wsparciu Nvidii i wizji Elona Muska xAI jest obecnie potężnym pretendentem w wyścigu o wysoką stawkę mający na celu zbudowanie przyszłości sztucznej inteligencji.