Google DeepMind on käynnistänyt uuden aloitteen kehittääkseen kehittyneitä tekoälyjärjestelmiä, jotka pystyvät simuloimaan fyysisiä ja virtuaalisia ympäristöjä.

Tim Brooks, entinen OpenAI:n tutkija, johtaa nyt työtä, joka keskittyy”maailmanmalleissa”– tekoälyjärjestelmissä, jotka on suunniteltu ennustamaan ja olemaan vuorovaikutuksessa todellisen maailman dynamiikan kanssa. X-viestissä Brooks totesi:”DeepMind on kunnianhimoinen aikoo tehdä massiivisia generatiivisia malleja, jotka simuloivat maailmaa.”

Tämä projekti liittyy läheisesti Googlen laajempaan tekoälyn (AGI) edistämisstrategiaan. Maailmanmalleja pidetään perustavanlaatuisena askeleena AGI:n saavuttamisessa, tekoälyn muodossa, joka pystyy suorittamaan minkä tahansa älyllisen tehtävän, jonka ihminen pystyy.

Uusi tiimi tekee yhteistyötä olemassa olevien DeepMind-projektien kanssa, mukaan lukien Gemini-multimodaalinen tekoäly malli, Veo-videoiden luontialusta ja Genie, vuorovaikutteisen ympäristön generaattori 3D-simulaatiot.

DeepMindillä on kunnianhimoisia suunnitelmia tehdä massiivisia generatiivisia malleja, jotka simuloivat maailmaa. Haen uutta tiimiä tähän tehtävään. Tule rakentamaan kanssamme!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl

– Tim Brooks (@_tim_brooks) 6. tammikuuta 2025

AI World Modeling

Maailman mallit edustavat merkittävää poikkeamaa perinteisistä tekoälyjärjestelmistä, jotka reagoivat ensisijaisesti syötettyihin tietoihin. Sen sijaan nämä mallit simuloivat monimutkaisia ​​ympäristöjä analysoimalla multimodaalista dataa, kuten tekstiä, kuvia ja videoita. Tämä ennakoiva ominaisuus mahdollistaa sovellukset eri aloilla robotiikkakoulutuksesta interaktiiviseen pelaamiseen.

Työn kuvaus uudelle tiimille korostaa laajempia tavoitteita: “Uskomme, että video-ja multimodaalisen datan esikoulutuksen skaalaus on kriittisellä tiellä kohti tekoälyä. Maailmanmallit toimivat useilla aloilla, kuten visuaalinen päättely ja simulointi, ruumiillistuneiden agenttien suunnittelu ja reaaliaikainen interaktiivinen viihde.”

Simuloimalla todellista dynamiikkaa maailmanmallit tarjoavat virtuaalisen hiekkalaatikon testausta ja oppimista, mikä parantaa tekoälyn kykyä mukautua ja reagoida tosielämän skenaarioihin.

DeepMindin Genie-projekti tarjoaa kurkistuksen mahdollisuuksiin. Joulukuussa lanseerattu Genie 2 voi luoda pelattavia 3D-maailmoja käyttäjien kehotteiden perusteella. Demonstraatioihin sisältyi purjehdusretkisimulaatio ja kyberpunk-aiheinen western, joka esitteli alustan monipuolisuutta interaktiivisten ympäristöjen luomisessa.

Google Genie 2:lla luotu interaktiivinen kehys kehykseltä AI-simulaatiodemo (Lähde: Google)

Teos Maailmanmalleissa on luonnostaan ​​monimutkainen, ja se vaatii huippuluokan infrastruktuuria ja valtavia laskennallisia resursseja mukana olevista haasteista. Vastuualueet ovat:

Suurten multimodaalisten muuntajien kouluttaminen, jotka pystyvät analysoimaan erilaisia ​​tietotyyppejä. Infrastruktuurin rakentaminen videodataputkille, mikä varmistaa tehokkaan kuraation ja merkinnän. Optimoi päättelyjärjestelmät reaaliaikaisiin sovelluksiin, mikä mahdollistaa saumattoman interaktiivisuuden. Kvantitatiivisten arviointimittareiden kehittäminen fyysisen tarkkuuden ja älykkyyden mittaamiseksi. Tutki ultrapitkän kontekstin muuntajia, joiden avulla tekoäly voi analysoida laajempia datasarjoja.

Skaalauksen painottaminen kuvastaa sitoutumista tekemään näistä järjestelmistä sekä kestäviä että tehokkaita. DeepMindin filosofia, joka on tiivistetty työnkuvaan tärkeimmiksi vastuiksi, korostaa tätä lähestymistapaa:

“Ota käyttöön ydininfrastruktuuri ja tee tutkimusta fyysisen maailman generatiivisten mallien rakentamiseksi. Ratkaise välttämättömät ongelmat maailman simulaattoreiden kouluttamiseksi massiivisessa mittakaavassa, kehitä mittareita ja skaalauslakeja fyysiselle älylle, kuroi ja kommentoi koulutusdataa, mahdollista reaaliaikainen interaktiivinen generointi ja tutki maailmanmallien integrointia multimodaalisiin kielimalleihin. Ota katkera oppitunti ja etsi yksinkertaisia, skaalautuvia menetelmiä painottaen vahvoja järjestelmiä ja infrastruktuuria.”

Sovellukset ja seuraukset

Maailmamalleilla on erilaisia ​​sovelluksia eri puolilla maailmaa. teollisuudessa ne mahdollistavat virtuaalisten ympäristöjen luomisen, joissa koneet voivat oppia navigoimaan ja käsittelemään kohteita. Tämä vähentää fyysisen testauksen aikaa ja kustannuksia

Carnegie Mellonin yliopiston ja yksityisten teollisuuden tutkijoiden kehittämä avoimen lähdekoodin fysiikan simulointialusta Genesis näyttää, kuinka tekoälyjärjestelmiä voidaan kouluttaa 3D-fysiikkaan täysin virtuaalisessa ympäristössä paljon nopeammin kuin todellisessa maailmassa.

Pelaamisessa maailmanmallit luovat mukaansatempaavia kokemuksia dynaamisissa ja reagoivissa ympäristöissä

Lupauksistaan ​​huolimatta nämä edistysaskeleet aiheuttavat haasteita, erityisesti työntekijöiden siirtymisen suhteen. Animation Guild arvioi, että tekoälyteknologiat voivat vaikuttaa yli 100 000 yhdysvaltalaiseen työpaikkaan elokuva-, televisio-ja animaatioalalla vuoteen 2026 mennessä.

Myös oikeudellisia ongelmia ilmenee, koska jotkin maailmanmallit luottavat lisensoimattomaan videopelimateriaaliin koulutusta. Vaikka Google väittää, että sen toimintatavat ovat YouTuben käyttöehtojen mukaisia, se ei ole paljastanut tiettyjä tietolähteitä.

Kilpailu tekoälyavaruudessa

DeepMindin aloiteasemat Google kilpailee muiden suurten toimijoiden kanssa. Nvidian uusi Cosmos-alusta keskittyy fyysiseen tekoälyyn ja robotiikkaan, kun taas Fei-Fei Li’s World Labs kehittää laajamittaisia ​​maailmanmalleja, joissa on tilaäly. monipuoliset sovellukset. Startup-yritykset, kuten Odyssey ja Decart tekevät myös edistysaskeleita, mikä myötävaikuttaa tekoälymaailman simulaatioiden kasvavaan alaan.

DeepMindin pääsy Gemini AI-, Veo-ja Genielle tarjoaa ainutlaatuisen edun. Integroimalla nämä järjestelmät tiimi pyrkii luomaan tekoälyä, joka ei vain ennusta tuloksia, vaan myös mukautuu muuttuviin skenaarioihin reaaliajassa. Tämä kyky voi olla kriittinen AGI:n saavuttamisessa, jossa sopeutumiskyky ja yleistäminen ovat avainasemassa.

DeepMind’s Vision for AGI

Vaikka yleinen tekoäly on kaukana, mutta saavutettavissa Tavoitteena on, että maailmanmallit ovat ratkaiseva askel tällä tiellä. Simuloimalla fyysisiä ja virtuaalisia ympäristöjä nämä mallit tarjoavat perustan tekoälyjärjestelmille, jotka voivat järkeillä, suunnitella ja olla vuorovaikutuksessa ihmisten tavoin.

Tutkijainsinöörin työnkuva sisältää DeepMindin vision olemuksen:”Maailmamallit ovat voimaa. lukuisia toimialueita, kuten visuaalinen päättely ja simulointi, ruumiillistuneiden agenttien suunnittelu ja reaaliaikainen interaktiivinen viihde.”

Categories: IT Info