Google DeepMind telah mendedahkan Genie 3, model AI baru yang membina dunia 3D yang boleh dimainkan dari arahan teks mudah. Diumumkan pada hari Selasa, sistem ini mewujudkan persekitaran interaktif ini dalam masa nyata, langkah utama dari versi terdahulu.

Langkah ini menandakan percepatan strategik dalam perlumbaan untuk membina model dunia asas. DeepMind melihat teknologi ini sebagai bahagian utama laluannya ke arah kecerdasan umum buatan (AGI). Dengan menguji ejen di Dunia Baru yang banyak, makmal itu bertujuan untuk membina AI yang dapat mengendalikan tugas-tugas dunia yang kompleks. Ia menggariskan komitmen yang jelas untuk mewujudkan AI yang memahami dan mensimulasikan realiti fizikal, dengan aplikasi masa depan dalam permainan, reka bentuk, dan robotik. Seconds to Minutes: Lompat dalam Generasi Dunia Real-Time

Genie 3 mewakili lompatan teknikal yang ketara ke atas pendahulunya, Genie 2, bergerak dari konsep bukti yang menjanjikan ke platform yang jauh lebih berkebolehan. Model baru menghasilkan dunia interaktif pada resolusi 720p, peningkatan utama dari output 360p pelopornya. Ia juga beroperasi pada bingkai 24 bingkai sesaat, menjadikan pengalaman masa nyata lebih lancar dan lebih mendalam.

Mungkin kemajuan yang paling kritikal adalah masa interaksi yang dilanjutkan. Walaupun simulasi Genie 2 sering mula menunjukkan artifak visual dan merendahkan selepas hanya 10 hingga 20 saat, Genie 3 dapat mengekalkan dunia yang konsisten dan visual yang konsisten untuk”beberapa minit,” model-model terdahulu yang terdahulu, Pilihan reka bentuk yang menjadi pusat kejayaannya. Shlomi Fruchter, seorang pengarah penyelidikan di Google DeepMind, menggambarkannya sebagai”Model Dunia Tujuan Umum Interaktif Pertama.”Proses berasaskan memori yang berurutan ini adalah apa yang membolehkan Genie 3 untuk membina pemahaman fizik yang intuitif dan konsisten tanpa bergantung pada enjin yang dikodkan keras. Penyelidikan AI. Makmal ini meletakkan model sebagai alat kritikal untuk latihan yang terkandung di ejen AI-sistem seperti robot atau avatar maya yang direka untuk beroperasi di ruang fizikal. dalam robotik dan pembangunan AI. Ejen latihan di dunia nyata adalah perlahan, mahal, dan berpotensi berbahaya. Model-model dunia seperti Genie 3 menawarkan penyelesaian dengan menyediakan kotak pasir yang selamat, berskala, dan tak terhingga untuk pembelajaran. Pelbagai senario”bagaimana jika”, Genie 3 boleh digunakan untuk mengajar sistem AI bagaimana menangani situasi yang tidak diliputi dalam latihan awal mereka. Sebagai contoh, seperti yang dinyatakan oleh Pengarah Penyelidikan DeepMind, ia boleh digunakan untuk melatih kereta memandu sendiri tentang bagaimana untuk bertindak balas terhadap pejalan kaki yang tiba-tiba muncul, tanpa perlu mengambil risiko perlanggaran dunia. 3 dengan sima ejen . Dalam demonstrasi, ejen itu diberi matlamat yang berbeza dan terpaksa mencapainya dengan menghantar perintah navigasi kepada Genie 3. Model dunia, tidak menyedari objektif ejen, hanya akan mensimulasikan akibat fizikal tindakan tersebut, memaksa Sima untuk merancang dan melaksanakan urutan tindakan yang lebih lama untuk berjaya. Ini menjadi tempat latihan yang ideal di mana ejen ditolak ke had mereka, dipaksa untuk berjuang, dan memperbaiki melalui percubaan dan kesilapan dengan cara yang mencerminkan bagaimana manusia belajar. Kepercayaan asas yang dikongsi di seluruh industri adalah bahawa AI harus terlebih dahulu belajar untuk”berfikir”dan merancang dalam simulasi dalaman yang tepat realiti sebelum ia dapat dipercayai untuk bertindak dengan pasti di dunia fizikal. Beliau mencadangkan industri itu belum lagi”bergerak 37 saat untuk agen yang terkandung,”di mana mereka boleh”sebenarnya mengambil tindakan baru di dunia nyata.”Untuk yang terkandung AI, momen sedemikian kekal sebagai yang paling utama, belum dapat dicapai, terobosan bahawa model-model dunia seperti Genie 3 direka untuk satu hari membolehkan.

Model ini dibebaskan sebagai”pratonton penyelidikan terhad”kepada sekumpulan kecil akademik dan pencipta, bukan orang awam. Pendekatan berhati-hati ini mencerminkan tahap baru yang baru.

Keterbatasan utama termasuk ruang tindakan terhad untuk ejen dalam simulasi. Tambahan pula, model bergelut dengan teks yang tepat dan tidak dapat mensimulasikan interaksi kompleks antara pelbagai agen bebas, seperti yang terperinci dalam dokumentasinya.

Tempoh simulasi, sementara bertambah baik, masih jauh dari waktu yang diperlukan untuk latihan ejen yang komprehensif. Fruchter mengakui jalan ke depan, dengan menyatakan,”Terdapat banyak perkara yang perlu berlaku sebelum model boleh digunakan di dunia nyata, tetapi kita melihatnya sebagai cara untuk melatih model yang lebih cekap dan meningkatkan kebolehpercayaan mereka.”Ini menonjolkan peranan semasa model sebagai alat penyelidikan dan bukannya produk yang boleh digunakan. Ia menggariskan cabaran teknikal yang besar yang kekal dalam membina AI yang benar-benar dapat mencerminkan kerumitan dunia kita.

Categories: IT Info