Google DeepMind heeft donderdag SIMA 2 onthuld, een nieuwe AI-agent die het Gemini-model gebruikt om te leren en te handelen in 3D-videogames. In tegenstelling tot zijn voorganger kan SIMA 2 nadenken over doelen op hoog niveau, met gebruikers praten en zichzelf nieuwe vaardigheden aanleren.

Het is getraind in populaire games zoals Goat Simulator 3 en kan zelfs spelen in werelden die het nog nooit eerder heeft gezien. Het project van DeepMind is een belangrijke stap in de richting van zijn doel: het bouwen van algemene AI. Het lab hoopt dat de vaardigheden die in games worden geleerd op een dag nuttige robots in de echte wereld zullen aandrijven.

Van instructievolger tot redenerende metgezel

Door een Gemini-model in de kern in te bedden, gaat SIMA 2 verder dan eenvoudige commando’s. Zijn voorganger, de oorspronkelijke SIMA die in maart 2024 werd geïntroduceerd, was een cruciale eerste stap, waarbij hij meer dan 600 taalvaardigheden leerde beheersen, zoals’de ladder beklimmen’in verschillende virtuele werelden.

Die agent opereerde door naar het scherm te kijken en een virtueel toetsenbord en muis te gebruiken, net zoals een menselijke speler dat zou doen. SIMA 2 bouwt voort op deze basis, maar voegt een kritische laag van cognitie toe, die evolueert van een tool naar een interactieve partner.

Nu kan de agent het hogere doel van een gebruiker begrijpen en redeneren over de stappen die nodig zijn om dit te bereiken.

Dit transformeert de interactie van het geven van commando’s naar het samenwerken met een metgezel.

“Games zijn al geruime tijd een drijvende kracht achter agentonderzoek”, zegt Joe Marino, een onderzoekswetenschapper bij Google DeepMind, tijdens een persconferentie.

Dankzij de integratie van Gemini kan SIMA 2 zijn bedoelingen beschrijven en zijn acties uitleggen, waardoor het proces transparanter en interactiever wordt voor de gebruiker.

[embedded content]

De training omvatte een mix van menselijke demonstratievideo’s en door Gemini gegenereerde labels. DeepMind werkte samen met talloze game-ontwikkelaars, waaronder Coffee Stain (Valheim, Satisfactory, Goat Simulator 3), Hello Games (No Man’s Sky) en Tuxedo Labs (Teardown), om een gevarieerde oefenterrein.

Blootstelling aan verschillende genres en spelmechanismen is de sleutel tot het ontwikkelen van een generalistische agent die niet gebonden is aan de regels van één enkele omgeving.

Een deugdzame cyclus: zelfverbetering in gegenereerde werelden

Een van de belangrijkste vorderingen van SIMA 2 is het vermogen om zichzelf te verbeteren. Na een eerste fase waarin hij leert van menselijke demonstraties, kan de agent een zelfverbeteringslus ingaan.

Hij oefent in nieuwe games door middel van zelfgestuurd spelen, waarbij hij vallen en opstaan gebruikt en feedback krijgt van het Gemini-model om zijn vaardigheden te verfijnen.

Dit proces stelt hem in staat nieuwe taken onder de knie te krijgen zonder dat er aanvullende door mensen gegenereerde gegevens nodig zijn, een belangrijke mijlpaal in de richting van schaalbaar leren.

Om de grenzen van deze mogelijkheid te verleggen, combineerde DeepMind SIMA 2 met een andere van zijn ambitieuze projecten: Genie 3.

Genie 3 is een wereldmodel dat nieuwe, speelbare 3D-omgevingen kan genereren via een eenvoudige tekstprompt. De architectuur is ontworpen met het oog op consistentie, en zoals onderzoeksdirecteur Shlomi Fruchter uitlegde:”auto-regressief, wat betekent dat het één frame tegelijk genereert. Het moet terugkijken op wat er eerder is gegenereerd om te beslissen wat er daarna gaat gebeuren.”

Sequentiële generatie is van cruciaal belang voor het creëren van stabiele werelden waar een agent kan leren.

Toen SIMA 2 in deze volledig nieuwe, door AI gegenereerde werelden werd geplaatst, demonstreerde het een opmerkelijk vermogen om zich aan te passen en zich te oriënteren. zichzelf en voert gebruikersinstructies uit.

Deze synergie creëert een krachtige trainingsdojo. Genie 3 kan een vrijwel oneindige verscheidenheid aan scenario’s genereren en een eindeloos curriculum bieden waar SIMA 2 van kan leren.

De strategie van DeepMind voor het bouwen van robuustere en aanpasbare AI is gebaseerd op deze aanpak.

“Wij denken dat wereldmodellen van cruciaal belang zijn op de weg naar AGI, met name voor belichaamde agenten, waarbij het simuleren van scenario’s uit de echte wereld bijzonder uitdagend is”, legt Jack Parker-Holder uit, een onderzoekswetenschapper in het team.

Het simuleren van talloze situaties is een veiligere, efficiëntere manier om een AI te leren over de complexiteit van interacties.

Voorbij het spel: het pad naar belichaamde AGI en zijn hindernissen

Hoewel de directe context videogames is, ligt de ultieme ambitie van DeepMind in de fysieke wereld. Vaardigheden SIMA 2 is leren – navigatie, gereedschapsgebruik, planning en samenwerking – zijn fundamentele bouwstenen voor belichaamde intelligentie.

Het bedrijf ziet dit onderzoek als een directe weg naar het creëren van capabele AI-assistenten en robots die veilig en effectief kunnen opereren in menselijke omgevingen.

“SIMA 2 bevestigt dat een AI die is getraind voor brede competentie… met succes de mogelijkheden van veel gespecialiseerde systemen kan verenigen in één coherente, generalistische agent”, aldus het SIMA-team in hun aankondiging, waarin ze de project als een unificatie van gespecialiseerde systemen in één enkele, samenhangende agent.

Het pad van virtuele werelden naar de realiteit is echter beladen met uitdagingen. Deskundigen op dit gebied erkennen weliswaar de technische prestaties, maar dringen aan op voorzichtigheid over de directe toepasbaarheid van deze vaardigheden.

Julian Togelius, een AI-onderzoeker aan de New York University, benadrukte de moeilijkheid van de aanpak en merkte op dat “in realtime spelen op basis van alleen visuele input een ‘harde modus’ is.” De agent moet onbewerkte pixels interpreteren zonder enige onderliggende spelgegevens, een taak die rekenintensief is en gevoelig voor fouten.

Verder zijn er vragen over hoe goed dit aangeleerde gedrag zal worden overgedragen op robotica.

Categories: IT Info