A Google DeepMind csütörtökön bemutatta a SIMA 2-t, egy új mesterséges intelligencia-ügynököt, amely a Gemini modellt használja a 3D-s videojátékokon belüli tanulásra és cselekvésre. Elődjétől eltérően a SIMA 2 képes magas szintű célokra gondolni, beszélgetni a felhasználókkal, és új készségeket sajátíthat el magának.

A népszerű játékokban, például a Goat Simulator 3-ban képezték ki, és még soha nem látott világokban is játszhat. A DeepMind projektje kulcsfontosságú lépés az általános mesterséges intelligencia felépítésének célja felé. A laboratórium azt reméli, hogy a játékokban elsajátított készségek egy napon a való világban is hasznos robotokat fognak kifejteni.

Az utasításkövetőtől az érvelő társig

A Gemini modell magjába ágyazásával a SIMA 2 túllép az egyszerű parancsokon. Elődje, az eredeti SIMA, amelyet 2024 márciusában mutattak be, döntő fontosságú első lépés volt, amely megtanulta a több mint 600 nyelvkövetési készség használatát az egész világon, pl. src=”https://winbuzzer.com/wp-content/uploads/2025/11/Google-SIMA-2-Agent.webp”>

Ez az ügynök úgy működött, hogy figyelte a képernyőt, és virtuális billentyűzetet és egeret használt, akárcsak egy emberi játékos. A SIMA 2 erre az alapra épít, de a megismerés egy kritikus rétegét egészíti ki, eszközből interaktív partnerré fejlődve.

Most az ügynök megérti a felhasználó magas szintű célját és érvelését az eléréséhez szükséges lépésekkel kapcsolatban.

Ez átalakítja az interakciót a parancsok adásából a társával való együttműködésre.

Joames ügynök már egy ideje a kutatást irányította.”a Google DeepMind kutatója egy sajtótájékoztatón.

A Gemini integrációja lehetővé teszi a SIMA 2 számára, hogy leírja szándékait és elmagyarázza tevékenységeit, így a folyamat átláthatóbbá és interaktívabbá válik a felhasználó számára.

[beágyazott tartalom]

A képzés emberi bemutató videók és Gemini által generált címkék keverékét foglalta magában. A DeepMind számos játékfejlesztővel együttműködött, köztük a Coffee Stainnel (Valheim, Satisfactory, Goat Simulator 3), a Hello Games-szel (No Man’s Sky) és a Tuxedo Labs-szal (Teardown), hogy egy változatos edzőterepet építs ki.

A különböző műfajok és játékszabályok közötti expozíció nem kulcsfontosságú az általános ügynökök fejlesztéséhez

.

Egy erényes ciklus: önfejlesztés a generált világokban

A SIMA 2 egyik legjelentősebb előrelépése az, hogy képes önmagában is fejlődni. Az emberi bemutatókból való tanulás kezdeti szakasza után az ügynök beléphet egy önfejlesztő körbe.

Az új játékokban önirányított játékon keresztül gyakorol, próba-szerencse módszert használ, és visszajelzést kap a Gemini-modelltől, hogy finomítsa készségeit.

Ez a folyamat lehetővé teszi, hogy új feladatokat sajátítson el anélkül, hogy további ember által generált adatokra lenne szüksége, ami egy jelentős mérföldkő felé haladva. ezt a képességet a DeepMind a SIMA 2-t egy másik ambiciózus projektjével kombinálta: a Genie 3-mal.

A Genie 3 egy olyan világmodell, amely új, játszható 3D-s környezeteket tud létrehozni egy egyszerű szöveges promptból. Architektúráját a következetességre tervezték, és ahogy Shlomi Fruchter kutatási igazgató kifejtette:”auto-regresszív, vagyis egyszerre csak egy képkockát hoz létre. Vissza kell tekintenie a korábban generált dolgokra, hogy eldöntse, mi fog történni.”

A szekvenciális generálás létfontosságú a stabil világok létrehozásához, ahol egy ügynök tanulhat.

Amikor az SIMA teljesen bekerült az új világba, az SIMA-t teljesen kifejlesztették. figyelemre méltó képesség az alkalmazkodásra, a tájékozódásra és a felhasználói utasítások végrehajtására.

Ez a szinergia erőteljes képzési dojo-t hoz létre. A Genie 3 szinte végtelen számú forgatókönyvet képes generálni, és végtelen tananyagot biztosít a SIMA 2 számára, amelyből tanulhat.

A DeepMind robusztusabb és alkalmazkodóbb mesterséges intelligencia felépítésére irányuló stratégiája erre a megközelítésre támaszkodik.

„Úgy gondoljuk, hogy a világmodellek kulcsfontosságúak az AGI felé vezető úton, különösen a megtestesült ügynökök számára” – magyarázta Jack, Parkol főként a való világ forgatókönyveinek szimulálását jelenti. Kutató a csapatban.

Számtalan helyzet szimulálása biztonságosabb és hatékonyabb módja annak, hogy egy mesterséges intelligenciát megtanítsunk az interakció bonyolultságára.

Túl a játékon: A megtestesült AGI és annak akadályai útja

Míg a közvetlen kontextus a videojátékokban rejlik, a Deep.Mintion fizikai ambiciózusa. A SIMA 2 tanulási képességei – a navigáció, az eszközhasználat, a tervezés és az együttműködés – a megtestesült intelligencia alapvető építőkövei.

A vállalat úgy látja, hogy ez a kutatás egy közvetlen út a megfelelő mesterséges intelligencia asszisztensek és robotok létrehozásához, amelyek biztonságosan és hatékonyan tudnak működni emberi környezetben.

„A SIMA 2 megerősíti, hogy a sokféle mesterséges intelligencia képességét sikeresen egységesítik… egy koherens, általános ügynök” – áll a SIMA Team közleményében, amelyben a projektet a speciális rendszerek egyetlen, koherens ágenssé egyesítéseként fogalmazták meg.

A virtuális világokból a valóságba vezető út azonban tele van kihívásokkal. A terület szakértői, bár elismerik a technikai vívmányt, óvatosságra intenek e készségek közvetlen alkalmazhatóságával kapcsolatban.

Julian Togelius, a New York-i Egyetem mesterséges intelligenciakutatója hangsúlyozta a megközelítés nehézségét, és megjegyezte, hogy „a valós időben valós idejű lejátszás csak vizuális bemenetről ’hard mode’’. Az ügynöknek értelmeznie kell a nyers képpontokat minden mögöttes játékadatok nélkül, ez a feladat nagy számításigényű és hibára hajlamos.

Továbbá kérdések merülnek fel azzal kapcsolatban, hogy ezek a tanult viselkedések mennyire lesznek átültetve a robotikába.

Categories: IT Info