Google DeepMind ka filluar një iniciativë të re për të krijuar sisteme të avancuara të inteligjencës artificiale (AI) të afta për të simuluar mjedise fizike dhe virtuale.
Tim Brooks, një ish-kërkues në OpenAI, tani drejton përpjekjen, e cila fokusohet në fokus. mbi”modelet botërore”-Sistemet e AI të krijuara për të parashikuar dhe ndërvepruar me dinamikën e botës reale. Në një postim në X, Brooks tha,”DeepMind ka plane ambicioze për të bërë modele masive gjeneruese që simulojnë botën.”
Ky projekt është i lidhur ngushtë me strategjinë më të madhe të Google për të avancuar inteligjencën e përgjithshme artificiale (AGI). Modelet botërore shihen si një hap themelor në arritjen e AGI, një formë e AI e aftë për të kryer çdo detyrë intelektuale që mundet një njeri.
Ekipi i ri do të bashkëpunojë me projektet ekzistuese DeepMind, duke përfshirë multimodalin AI Gemini modeli, platforma e gjenerimit të videove Veo dhe Genie, një gjenerues mjedisi për simulimet interaktive 3D.
DeepMind ka plane ambicioze për të bërë modele masive gjeneruese që simulojnë botën. Unë jam duke punësuar për një ekip të ri me këtë mision. Ejani të ndërtoni me ne!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
— Tim Brooks (@_tim_brooks) 6 janar 2025
Model Botëror i AIing
Modelet botërore përfaqësojnë një largim domethënës nga sistemet tradicionale të AI, të cilat kryesisht reagojnë ndaj hyrjeve të të dhënave. Në vend të kësaj, këto modele simulojnë mjedise komplekse duke analizuar të dhënat multimodale, të tilla si teksti, imazhet dhe videot. Kjo aftësi parashikuese mundëson aplikime në fusha të ndryshme, nga trajnimi i robotikës deri tek lojërat interaktive.
a> për ekipin e ri nënvizon qëllimet më të gjera: “Ne besojmë se shkallëzimi i trajnimit paraprak në video dhe të dhëna multimodale është në rrugën kritike drejt inteligjencës së përgjithshme artificiale. Modelet botërore do të fuqizojnë domene të shumta, të tilla si arsyetimi dhe simulimi vizual, planifikimi për agjentët e mishëruar dhe argëtimi interaktiv në kohë reale.”
Duke simuluar dinamikën e botës reale, modelet botërore ofrojnë një kuti rëre virtuale për testim dhe të mësuarit, duke rritur aftësinë e AI për t’u përshtatur dhe përgjigjur në skenarë të botës reale.
Projekti Genie i DeepMind ofron një Shihni mundësitë I lançuar në dhjetor, Genie 2 mund të gjenerojë botë të luajtshme 3D bazuar në kërkesat e përdoruesve.”732″lartësi=”412″src=”https://winbuzzer.com/wp-content/uploads/2025/01/image.png”>Demo ndërvepruese kornizë për kornizë simulimi AI krijuar me Google Genie 2 (Burimi: Google)
Puna në modelet botërore është në thelb kompleks, duke kërkuar infrastrukturë moderne dhe burime të mëdha llogaritëse për një rol të inxhinierit kërkimor në modelimin botëror përshkruan sfidat teknike të përfshira. Përgjegjësitë përfshijnë:
Trajnimin e transformatorëve multimodalë në shkallë të gjerë të aftë për të analizuar lloje të ndryshme të dhënash. Ndërtimi i infrastrukturës për tubacionet e të dhënave video, duke siguruar kurim dhe shënim efikas. Optimizimi i sistemeve të konkluzioneve për aplikacione në kohë reale, duke mundësuar ndërveprim pa probleme. Zhvillimi i matjeve sasiore të vlerësimit për të matur saktësinë fizike dhe inteligjencën. Eksplorimi i transformatorëve me kontekst ultra të gjatë, të cilët lejojnë AI të analizojë sekuenca të zgjeruara të të dhënave.
Theksi në shkallëzimin pasqyron një angazhim për t’i bërë këto sisteme të qëndrueshme dhe efikase. Filozofia e DeepMind, e përmbledhur si përgjegjësitë kryesore në përshkrimin e punës, nënvizon këtë qasje:
“Zbatoni infrastrukturën bazë dhe kryeni kërkime për të ndërtuar modele gjeneruese të botës fizike. Zgjidh problemet thelbësore për të trajnuar simulatorët botërorë në shkallë masive, për të zhvilluar metrikë dhe ligje të shkallëzimit për inteligjencën fizike, kuroni dhe shënoni të dhënat e trajnimit, mundësoni gjenerimin interaktiv në kohë reale dhe studioni integrimin e modeleve botërore me modelet e gjuhës multimodale. Përqafoni mësimin e hidhur dhe kërkoni metoda të thjeshta të shkallës, me theks në sistemet dhe infrastrukturën e fortë.”
Zbatimet dhe implikimet
Modelet botërore kanë aplikime të ndryshme në të gjithë Në industrinë e robotikës, ato mundësojnë krijimin e mjediseve virtuale ku makinat mund të mësojnë të lundrojnë dhe të manipulojnë objektet
Zanafilla, një platformë simulimi fizik me burim të hapur e zhvilluar nga Universiteti Carnegie Mellon dhe studiues të industrisë private, tregon se si sistemet e AI mund të trajnohen për fizikën 3D në një mjedis krejtësisht virtual shumë më shpejt se në botën reale.
Në lojëra, modelet botërore krijojnë përvoja gjithëpërfshirëse me mjedise dinamike dhe reaguese. Teknologjia gjithashtu ka potencial në kujdesin shëndetësor, ku simulimet mund të ndihmojnë në diagnostikimin dhe planifikimi i personalizuar i trajtimit.
Megjithë premtimin e tyre, këto përparime vijnë me sfida, veçanërisht në lidhje me zhvendosjen e punëtorëve. The Animation Guild vlerëson se mbi 100,000 vende pune me bazë në SHBA në film, televizion dhe animacion mund të preken nga teknologjitë e AI deri në vitin 2026.
Ngrihen gjithashtu çështje ligjore, pasi disa modele botërore mbështeten në pamjet e palicencuara të lojërave video për trajnimi. Ndërsa Google pohon se praktikat e tij janë në përputhje me kushtet e shërbimit të YouTube, ai nuk ka zbuluar burime specifike të të dhënave.
Konkurrenca në hapësirën e AI
Pozicionet e iniciativës së DeepMind-it. Google në një garë konkurruese me lojtarë të tjerë të mëdhenj. Platforma e re Cosmos e Nvidia fokusohet në AI fizike dhe robotikë, ndërsa Laboratorët Botërorë të Fei-Fei Li zhvillon modele botërore në shkallë të gjerë me inteligjencë hapësinore për aplikacione të ndryshme. Startups si Odyssey dhe Decart po bëjnë gjithashtu hapa, duke kontribuar në fushën në rritje të simulimeve të botës së AI.
Qasja e DeepMind në Gemini AI, Veo dhe Genie ofron një avantazh unik. Duke integruar këto sisteme, ekipi synon të krijojë AI që jo vetëm parashikon rezultatet, por gjithashtu përshtatet me ndryshimin e skenarëve në kohë reale. Kjo aftësi mund të jetë kritike për arritjen e AGI, ku përshtatshmëria dhe përgjithësimi janë thelbësore.
Vizioni i DeepMind për AGI
Ndërsa inteligjenca e përgjithshme artificiale mbetet e largët, por e arritshme. qëllimi, modelet botërore janë një hap vendimtar në këtë rrugë. Duke simuluar mjediset fizike dhe virtuale, këto modele ofrojnë një bazë për sistemet e AI që mund të arsyetojnë, planifikojnë dhe ndërveprojnë si njerëzit.
Përshkrimi i punës së Inxhinierit të Kërkimit kap thelbin e vizionit të DeepMind: “Modelet botërore do të fuqizojnë. fusha të shumta, të tilla si arsyetimi dhe simulimi vizual, planifikimi për agjentët e mishëruar dhe argëtimi interaktiv në kohë reale.”