Startup AI milik Elon Musk, xAI, mempercepat pengembangan “model dunia” yang mensimulasikan realitas dengan merekrut ahli-ahli penting dari raksasa chip Nvidia.
Menurut laporan, perusahaan ini mendatangkan peneliti AI Zeeshan Patel dan Ethan He selama musim panas, yang menandakan tantangan langsung bagi para pemimpin industri dalam hal yang akan menjadi cabang AI besar berikutnya ras.
Dorongan strategis ini menggarisbawahi semakin pentingnya model dunia—AI canggih yang dapat memahami dan memprediksi lingkungan fisik. Bagi Musk dan para pesaingnya, penguasaan teknologi ini merupakan langkah penting menuju penciptaan AI yang lebih mumpuni untuk robotika, game, dan pada akhirnya, kecerdasan umum buatan (AGI).
Langkah ini juga memperdalam hubungan antara kedua perusahaan. Nvidia bukan hanya sumber bakat tetapi juga investor yang dikonfirmasi di xAI, sebuah fakta yang baru-baru ini dikonfirmasi oleh CEO Jensen Huang. Aliansi ini menyoroti besarnya sumber daya komputasi yang diperlukan untuk membangun model-model canggih ini.
xAI Memasuki Pertarungan dengan Bakat dan Investasi Nvidia
Meskipun xAI dikenal dengan chatbot Grok-nya, inisiatif baru ini menandai ekspansi signifikan di luar model bahasa. Perekrutan talenta dari Nvidia, pemimpin dalam simulasi dengan platform Omniverse-nya, merupakan pernyataan niat yang jelas untuk membangun AI yang memahami dan berinteraksi dengan ruang 3D, bukan hanya teks.
Ambisi xAI tidak semata-mata bersifat akademis. Musk telah secara terbuka menyatakan tujuan perusahaannya untuk merilis “game hebat yang dihasilkan oleh AI sebelum akhir tahun depan.” Garis waktu yang agresif ini menunjukkan bahwa xAI berfokus pada menerjemahkan penelitian mutakhir menjadi produk nyata, yang berpotensi mengganggu industri hiburan interaktif.
Untuk mencapai hal ini, perusahaan sedang membangun “tim omni”yang berfokus pada sistem AI yang dapat memahami dan menghasilkan konten dalam berbagai format, termasuk foto, video, dan audio. Perekrutan Patel, yang karyanya berfokus pada model generatif dan visi 3D, sejalan dengan strategi multimodal ini.
Apa Itu Model Dunia dan Mengapa Penting?
Model dunia mewakili perubahan mendasar dalam pengembangan AI. Daripada hanya memproses data, mereka membangun simulasi realitas internal, yang memungkinkan mereka memprediksi bagaimana tindakan akan terjadi di ruang fisik. Kemampuan ini dipandang sebagai landasan bagi masa depan AI.
Tidak seperti mesin fisika tradisional yang mengandalkan aturan yang dikodekan, model ini mempelajari pemahaman intuitif tentang realitas dengan menganalisis data video dalam jumlah besar. Seperti yang dijelaskan oleh Juan Bernabé-Moreno, direktur di IBM Research, “Model dunia memungkinkan mesin merencanakan pergerakan dan interaksi di ruang simulasi, yang sering disebut ‘kembar digital’, sebelum mencobanya di dunia fisik.”
Pendekatan “kembar digital”ini memungkinkan AI untuk belajar dari uji coba di lingkungan virtual yang aman, sehingga secara signifikan mempercepat pelatihan untuk tugas-tugas seperti robotika dan navigasi otonom.
Inilah sebabnya banyak orang di bidang ini percaya bahwa model dunia sangat penting untuk mencapai AGI. Jack Parker-Holder, seorang ilmuwan peneliti di DeepMind, menekankan hal ini, dengan menyatakan, “kami pikir model dunia adalah kunci menuju AGI, khususnya untuk agen yang diwujudkan, di mana simulasi skenario dunia nyata sangatlah menantang.”
Area yang Ramai: Perlombaan Global untuk Mensimulasikan Realitas
xAI memasuki arena yang sangat kompetitif. Google DeepMind telah menjadi kekuatan yang dominan, dan secara resmi membentuk tim model dunia yang berdedikasi pada awal tahun 2025. Pemimpin tim tersebut, Tim Brooks, mengumumkan bahwa “DeepMind memiliki rencana ambisius untuk membuat model generatif besar-besaran yang menyimulasikan dunia”, yang menandakan komitmen signifikan perusahaan tersebut.
Teknologi DeepMind telah berkembang pesat. Model awal Genie 2, yang dirilis pada akhir tahun 2024, hanya dapat mempertahankan simulasi selama sekitar 20 detik. Penerusnya, Genie 3, yang diluncurkan pada Agustus 2025, mewakili lompatan besar, menghasilkan dunia 3D interaktif selama beberapa menit dan bahkan memungkinkan perubahan real-time melalui perintah teks.
Meta juga mempertaruhkan klaimnya dengan V-JEPA 2, sebuah model sumber terbuka yang dirancang untuk memberikan akal sehat fisik pada robot dengan belajar dari video. Sementara itu, raksasa teknologi Tiongkok Tencent telah merilis HunyuanWorld-Voyager, yang dapat menciptakan dunia 3D yang dapat dijelajahi dari satu gambar dan telah menunjukkan kinerja yang kuat pada tolok ukur industri.
Jalan ke Depan: Dari Riset Ambisius ke Dampak Dunia Nyata
Meskipun ada kemajuan pesat, teknologi ini masih dalam tahap awal. Para peneliti mengakui bahwa masih terdapat banyak kendala sebelum model ini dapat diterapkan secara andal. Tantangan utamanya adalah memperpanjang durasi simulasi dan memastikan tindakan AI akurat dan aman secara fisik.
Model saat ini juga kesulitan melakukan tugas tertentu seperti merender teks secara akurat atau mensimulasikan interaksi kompleks antara beberapa agen independen. Shlomi Fruchter, Direktur Riset di Google DeepMind, memperingatkan bahwa “ada banyak hal yang harus dilakukan sebelum suatu model dapat diterapkan di dunia nyata, namun kami melihatnya sebagai cara untuk melatih model dengan lebih efisien dan meningkatkan keandalannya.”
Pengembangan model dunia adalah sebuah maraton, bukan lari cepat. Hal ini membutuhkan investasi besar dalam bidang bakat, data, dan daya komputasi. Dengan dukungan Nvidia dan visi Elon Musk, xAI kini menjadi pesaing tangguh dalam perlombaan berisiko tinggi untuk membangun masa depan kecerdasan buatan.