xAI, la startup AI di Elon Musk, sta accelerando lo sviluppo di”modelli mondiali”che simulano la realtà assumendo esperti chiave del gigante dei chip Nvidia.
Secondo rapporti, l’azienda ha coinvolto i ricercatori sull’intelligenza artificiale Zeeshan Patel e Ethan He durante l’estate, segnalando una sfida diretta ai leader del settore in quella che sta diventando la prossima grande corsa agli armamenti legati all’intelligenza artificiale.
Questa spinta strategica sottolinea la crescente importanza dei modelli mondiali: l’intelligenza artificiale avanzata in grado di comprendere e prevedere gli ambienti fisici. Per Musk e i suoi rivali, padroneggiare questa tecnologia è un passo fondamentale verso la creazione di un’intelligenza artificiale più capace per la robotica, i giochi e, in definitiva, l’intelligenza generale artificiale (AGI).
La mossa approfondisce anche i legami tra le due società. Nvidia non è solo una fonte di talento ma anche un investitore confermato in xAI, un fatto recentemente confermato dal CEO Jensen Huang. Questa alleanza evidenzia le immense risorse computazionali necessarie per costruire questi modelli sofisticati.
xAI entra nella mischia con Nvidia Talent and Investment
Sebbene xAI sia noto per il suo chatbot Grok, questa nuova iniziativa segna un’espansione significativa oltre i modelli linguistici. L’assunzione di talenti da Nvidia, leader nella simulazione con la sua piattaforma Omniverse, è una chiara dichiarazione di intenti per costruire un’intelligenza artificiale che comprenda e interagisca con lo spazio 3D, non solo con il testo.
Le ambizioni di xAI non sono puramente accademiche. Musk ha dichiarato pubblicamente che l’obiettivo dell’azienda è quello di rilasciare un”fantastico gioco generato dall’intelligenza artificiale entro la fine del prossimo anno”. Questa linea temporale aggressiva suggerisce che xAI si concentra sulla traduzione della ricerca all’avanguardia in prodotti tangibili, potenzialmente sconvolgendo il settore dell’intrattenimento interattivo.
Per raggiungere questo obiettivo, l’azienda sta costruendo un”team omni”focalizzato sui sistemi di intelligenza artificiale in grado di comprendere e generare contenuti in vari formati, tra cui foto, video e audio. L’assunzione di Patel, il cui lavoro si concentra su modelli generativi e visione 3D, è direttamente in linea con questa strategia multimodale.
Che cosa sono i modelli mondiali e perché sono importanti?
I modelli mondiali rappresentano un cambiamento fondamentale nello sviluppo dell’intelligenza artificiale. Invece di limitarsi a elaborare i dati, costruiscono una simulazione interna della realtà, consentendo loro di prevedere come si svolgeranno le azioni in uno spazio fisico. Questa capacità è vista come una pietra angolare per il futuro dell’intelligenza artificiale.
A differenza dei motori fisici tradizionali che si basano su regole codificate, questi modelli apprendono una comprensione intuitiva della realtà analizzando grandi quantità di dati video. Come ha spiegato Juan Bernabé-Moreno, direttore di IBM Research,”I modelli mondiali consentono alle macchine di pianificare movimenti e interazioni in spazi simulati, spesso chiamati”gemelli digitali”, prima di tentarli nel mondo fisico.”
Questo approccio”gemello digitale”consente a un’intelligenza artificiale di apprendere per tentativi ed errori in un ambiente virtuale sicuro, accelerando notevolmente la formazione per compiti come robotica e navigazione autonoma.
Ecco perché molti nel settore ritengono che i modelli mondiali siano essenziali per raggiungere l’AGI. Jack Parker-Holder, ricercatore presso DeepMind, ha sottolineato questo punto, affermando:”pensiamo che i modelli mondiali siano fondamentali nel percorso verso l’AGI, in particolare per gli agenti incarnati, dove simulare scenari del mondo reale è particolarmente impegnativo.”
A Crowded Field: The Global Race to Simulate Reality
xAI sta entrando in un’arena altamente competitiva. Google DeepMind è stata una forza dominante, creando formalmente un team dedicato ai modelli mondiali all’inizio del 2025. Il leader del team, Tim Brooks, ha annunciato che”DeepMind ha piani ambiziosi per realizzare enormi modelli generativi che simulano il mondo”, segnalando il significativo impegno dell’azienda.
La tecnologia di DeepMind si è evoluta rapidamente. Il suo primo modello Genie 2, rilasciato alla fine del 2024, poteva sostenere le simulazioni solo per circa 20 secondi. Il suo successore, Genie 3, presentato nell’agosto 2025, rappresenta un enorme passo avanti, generando mondi 3D interattivi per diversi minuti e consentendo persino modifiche in tempo reale tramite istruzioni di testo.
Meta ha anche rivendicato la sua rivendicazione con V-JEPA 2, un modello open source progettato per dare ai robot il buon senso fisico imparando dai video. Nel frattempo, il gigante tecnologico cinese Tencent ha rilasciato HunyuanWorld-Voyager, che può creare mondi 3D esplorabili da una singola immagine e ha mostrato ottime prestazioni rispetto ai benchmark del settore.
La strada da percorrere: dalla ricerca ambiziosa all’impatto nel mondo reale
Nonostante i rapidi progressi, la tecnologia è ancora nelle fasi iniziali. I ricercatori riconoscono che rimangono ostacoli significativi prima che questi modelli possano essere implementati in modo affidabile. Le sfide principali includono l’estensione della durata della simulazione e la garanzia che le azioni dell’IA siano fisicamente accurate e sicure.
I modelli attuali hanno anche difficoltà con compiti specifici come il rendering accurato del testo o la simulazione di interazioni complesse tra più agenti indipendenti. Shlomi Fruchter, direttore della ricerca presso Google DeepMind, ha avvertito che”ci sono molte cose che devono accadere prima che un modello possa essere implementato nel mondo reale, ma lo consideriamo come un modo per addestrare i modelli in modo più efficiente e aumentarne l’affidabilità.”
Lo sviluppo di modelli mondiali è una maratona, non uno sprint. Richiede immensi investimenti in talento, dati e potenza di calcolo. Con il sostegno di Nvidia e la visione di Elon Musk, xAI è ora un formidabile contendente nella corsa ad alto rischio per costruire il futuro dell’intelligenza artificiale.