DeepMind, bagian penelitian AI Google, telah memperkenalkan Genie 2, model canggih yang mampu menghasilkan lingkungan 3D interaktif. Berbeda dengan pendahulunya, yang terbatas pada keluaran dua dimensi, Genie 2 menawarkan ruang virtual dinamis yang bereaksi terhadap masukan pengguna secara real-time.
Ini merupakan langkah signifikan dalam evolusi penelitian dan pelatihan AI, yang menyediakan peluang yang belum pernah terjadi sebelumnya untuk desain kreatif dan pengembangan sistem AI generalis.
Perbatasan Baru dalam Lingkungan Interaktif
Genie 2 beroperasi sebagai model difusi laten, membangun simulasi frame-by-frame berdasarkan satu gambar atau teks prompt. Pengguna dapat mendeskripsikan skenario dengan kata-kata atau memilih gambar yang dihasilkan oleh model Imagen 3 DeepMind untuk menciptakan ruang yang sepenuhnya interaktif.
Sistem mendukung berbagai perspektif, termasuk tampilan orang pertama, orang ketiga, dan isometrik, memungkinkan beragam aplikasi dalam penelitian AI dan alur kerja kreatif.
DeepMind menggambarkan Genie 2 memungkinkan pengguna untuk “menggambarkan dunia yang mereka inginkan dalam teks, memilih rendering ide favorit mereka, lalu masuk dan berinteraksi dengannya dunia yang baru tercipta.”
Kemampuan ini menjembatani kesenjangan antara seni konsep dan lingkungan fungsional, menjadikannya alat yang berharga bagi desainer dan peneliti.
Kemampuan dan Keterbatasan
Salah satu kemajuan utama Genie 2 adalah kemampuannya untuk mempertahankan memori elemen di luar layar, memungkinkan rekonstruksi yang konsisten ketika elemen tersebut masuk kembali ke tampilan pengguna. Kemampuan ini membedakannya dari model seperti Decart’s Oasis, yang kesulitan dengan memori spasial dan sering kehilangan jejak tata letak adegan selama simulasi real-time.
Namun, Genie 2 memiliki keterbatasan. Kebanyakan simulasi berlangsung antara 10 dan 20 detik sebelum artefak visual dan kualitas gambar yang menurun muncul. Meskipun model ini dapat mempertahankan lingkungan yang kohesif secara visual hingga satu menit, DeepMind menyadari bahwa durasi yang diperpanjang tetap menjadi tantangan teknis.
Riset perusahaan menggarisbawahi pentingnya pengembangan berkelanjutan. Google mengatakan penelitiannya menunjukkan potensi Genie 2 untuk melatih agen di lingkungan yang belum pernah mereka lihat, mempercepat kemajuan menuju AI umum, menyoroti peran model dalam menciptakan beragam skenario yang menguji kemampuan adaptasi AI.
Mentransformasi AI Pelatihan dan Pembuatan Prototipe Kreatif
Aplikasi utama Genie 2 terletak pada penelitian dan desain kreatif. Bagi para peneliti, model ini menawarkan platform untuk mengevaluasi agen AI di lingkungan yang asing, sebuah langkah penting menuju pengembangan sistem yang mampu menangani beragam tantangan dunia nyata.
Model ini juga menjanjikan bagi industri kreatif. Seniman dan desainer konsep dapat menggunakan Genie 2 untuk membuat prototipe lingkungan interaktif dengan cepat, mengubah sketsa atau deskripsi menjadi ruang 3D yang fungsional. DeepMind memamerkan contoh model yang menyimulasikan beragam latar, mulai dari robot humanoid yang menjelajahi hutan hingga avatar futuristik yang menjelajahi loteng perkotaan.
Utilitas ganda ini memposisikan Genie 2 sebagai alat penelitian dan katalis inovasi dalam bidang teknologi. alur kerja yang kreatif, memungkinkan eksperimen dan iterasi yang cepat.
Tantangan Etis dan Teknis
Meskipun DeepMind menegaskan kepatuhannya terhadap standar etika, kurangnya transparansi menyoroti ketegangan yang sedang berlangsung antara inovasi dan praktik AI yang bertanggung jawab.
Secara teknis, model ini mengandalkan proses difusi laten autoregresif, yang menghasilkan frame secara berurutan berdasarkan tindakan sebelumnya dan representasi laten. Pendekatan ini memungkinkan simulasi yang dinamis dan real-time, namun menimbulkan tantangan dalam menjaga ketelitian dan konsistensi dalam jangka waktu yang lebih lama.
Integrasi dengan Sistem AI
Dengan menghasilkan agen lingkungan belum pernah ditemui sebelumnya, Genie 2 mendorong batas-batas evaluasi AI. Kemampuan untuk membuat skenario baru ini mendukung pengembangan sistem AI yang lebih mudah beradaptasi dan serbaguna.
Arah Masa Depan dan Implikasi yang Lebih Luas
Sementara Genie 2 mewakili kemajuan yang signifikan , tantangan masih ada dalam memperluas kemampuan model. DeepMind terus menyempurnakan sistem memorinya dan meningkatkan fidelitas simulasi berdurasi panjang. Perekrutan terbaru dari organisasi seperti OpenAI dan Meta menandakan komitmen perusahaan untuk memajukan teknologi dunia yang dihasilkan AI.
Potensi penerapan Genie 2 jauh melampaui penelitian dan desain. Mulai dari game dan realitas virtual hingga perencanaan kota dan sistem otonom, kemampuan model untuk menghasilkan lingkungan yang realistis dan interaktif memiliki implikasi yang luas.