Google DeepMind telah memulakan inisiatif baharu untuk mencipta sistem kecerdasan buatan (AI) termaju yang mampu mensimulasikan persekitaran fizikal dan maya.

Tim Brooks, bekas penyelidik di OpenAI, kini mengetuai usaha itu, yang memfokuskan pada”model dunia”—sistem AI yang direka bentuk untuk meramal dan berinteraksi dengan dinamik dunia sebenar. Dalam siaran di X, Brooks menyatakan,”DeepMind mempunyai rancangan bercita-cita tinggi untuk membuat model generatif besar-besaran yang meniru dunia.”

Projek ini berkait rapat dengan strategi Google yang lebih besar untuk memajukan kecerdasan am buatan (AGI). Model dunia dilihat sebagai langkah asas dalam mencapai AGI, satu bentuk AI yang mampu melaksanakan sebarang tugas intelektual yang boleh dilakukan oleh manusia.

Pasukan baharu akan bekerjasama dengan projek DeepMind sedia ada, termasuk AI multimodal Gemini model, platform penjanaan video Veo dan Genie, penjana persekitaran untuk 3D interaktif simulasi.

DeepMind mempunyai rancangan bercita-cita tinggi untuk membuat model generatif besar-besaran yang mensimulasikan dunia. Saya sedang mengupah pasukan baharu dengan misi ini. Mari bina bersama kami!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl

— Tim Brooks (@_tim_brooks) 6 Januari 2025

Model Dunia AIing

Model dunia mewakili perubahan ketara daripada sistem AI tradisional, yang bertindak balas terutamanya kepada data input. Sebaliknya, model ini mensimulasikan persekitaran yang kompleks dengan menganalisis data berbilang mod, seperti teks, imej dan video. Keupayaan ramalan ini membolehkan aplikasi dalam pelbagai bidang, daripada latihan robotik kepada permainan interaktif.

Satu huraian kerja

a> untuk pasukan baharu menyerlahkan matlamat yang lebih luas: “Kami percaya penskalaan pralatihan pada video dan data berbilang mod adalah pada laluan kritikal kepada kecerdasan am buatan. Model dunia akan menguasai banyak domain, seperti penaakulan visual dan simulasi, perancangan untuk ejen yang terkandung dan hiburan interaktif masa nyata.”

Dengan mensimulasikan dinamik dunia sebenar, model dunia menyediakan kotak pasir maya untuk ujian dan pembelajaran, meningkatkan keupayaan AI untuk menyesuaikan diri dan bertindak balas dalam senario dunia sebenar.

Projek DeepMind’s Genie menawarkan gambaran sekilas tentang kemungkinan yang dilancarkan pada bulan Disember, Genie 2 boleh menjana dunia 3D yang boleh dimainkan berdasarkan gesaan pengguna Demonstrasi termasuk simulasi ekspedisi belayar dan Barat bertemakan siberpunk, yang mempamerkan kepelbagaian platform dalam mencipta persekitaran interaktif.

Demo simulasi AI bingkai demi bingkai interaktif dibuat dengan Google Genie 2 (Sumber: Google)

Kerja pada model dunia sememangnya kompleks, memerlukan infrastruktur canggih dan sumber pengiraan yang luas tawaran kerja DeepMind untuk peranan Jurutera Penyelidik dalam pemodelan dunia menggariskan cabaran teknikal terlibat. Tanggungjawab termasuk:

Melatih pengubah multimodal berskala besar yang mampu menganalisis pelbagai jenis data. Membina infrastruktur untuk saluran paip data video, memastikan penyusunan dan anotasi yang cekap. Mengoptimumkan sistem inferens untuk aplikasi masa nyata, membolehkan interaktiviti yang lancar. Membangunkan metrik penilaian kuantitatif untuk mengukur ketepatan fizikal dan kecerdasan. Meneroka pengubah konteks ultra-panjang, yang membolehkan AI menganalisis jujukan data lanjutan.

Penekanan pada penskalaan mencerminkan komitmen untuk menjadikan sistem ini teguh dan cekap. Falsafah DeepMind, yang diringkaskan sebagai tanggungjawab utama dalam huraian kerja, menggariskan pendekatan ini:

“Melaksanakan infrastruktur teras dan menjalankan penyelidikan untuk membina model generatif dunia fizikal. Menyelesaikan masalah penting untuk melatih simulator dunia pada skala besar, membangunkan metrik dan undang-undang penskalaan untuk kecerdasan fizikal, menyusun dan menganotasi data latihan, membolehkan penjanaan interaktif masa nyata dan mengkaji integrasi model dunia dengan model bahasa multimodal. Terima pelajaran pahit dan cari kaedah mudah yang berskala, dengan penekanan pada sistem dan infrastruktur yang kukuh.”

Aplikasi dan Implikasi

Model dunia mempunyai aplikasi yang pelbagai di seluruh industri. Dalam robotik, mereka membolehkan penciptaan persekitaran maya di mana mesin boleh belajar menavigasi dan memanipulasi objek Ini mengurangkan masa dan kos ujian fizikal platform simulasi fizik sumber terbuka yang dibangunkan oleh Carnegie Mellon University dan penyelidik industri swasta, menunjukkan cara sistem AI boleh dilatih untuk fizik 3D dalam persekitaran maya sepenuhnya dengan lebih pantas berbanding di dunia nyata.

Dalam permainan, dunia model mencipta pengalaman mendalam dengan persekitaran yang dinamik dan responsif Teknologi ini juga berpotensi dalam penjagaan kesihatan, di mana simulasi boleh membantu dalam diagnostik dan perancangan rawatan yang diperibadikan.

Walaupun dijanjikan, kemajuan ini disertakan bersama. cabaran. Persatuan Animasi menganggarkan bahawa lebih 100,000 pekerjaan yang berpangkalan di A.S. dalam filem, televisyen dan animasi boleh terjejas oleh teknologi AI menjelang 2026.

Isu undang-undang juga timbul, kerana sesetengah model dunia bergantung pada rakaman permainan video tidak berlesen untuk latihan. Walaupun Google menegaskan bahawa amalannya mematuhi syarat perkhidmatan YouTube, ia tidak mendedahkan sumber data tertentu.

Persaingan dalam Angkasa AI

Kedudukan inisiatif DeepMind Google dalam perlumbaan kompetitif dengan pemain utama yang lain. Platform Cosmos baharu Nvidia memfokuskan pada AI fizikal dan robotik, manakala World Labs Fei-Fei Li membangunkan model dunia berskala besar dengan kecerdasan spatial untuk aplikasi yang pelbagai. Pemula seperti Odyssey dan Decart juga membuat langkah, menyumbang kepada bidang simulasi dunia AI yang semakin berkembang.

Akses DeepMind kepada Gemini AI, Veo dan Genie menawarkan kelebihan unik. Dengan menyepadukan sistem ini, pasukan berhasrat untuk mencipta AI yang bukan sahaja meramalkan hasil tetapi juga menyesuaikan diri dengan senario yang berubah dalam masa nyata. Keupayaan ini boleh menjadi kritikal untuk mencapai AGI, di mana kebolehsuaian dan generalisasi adalah kunci.

Wawasan DeepMind untuk AGI

Walaupun kecerdasan am buatan kekal jauh tetapi boleh dicapai matlamat, model dunia adalah langkah penting dalam laluan ini. Dengan mensimulasikan persekitaran fizikal dan maya, model ini menyediakan asas untuk sistem AI yang boleh menaakul, merancang dan berinteraksi seperti manusia.

Penerangan kerja Jurutera Penyelidik menangkap intipati visi DeepMind: “Model dunia akan berkuasa pelbagai domain, seperti penaakulan visual dan simulasi, perancangan untuk ejen yang terkandung dan hiburan interaktif masa nyata.”

Categories: IT Info