Google DeepMind ka zbuluar një model të ri AI që lejon robotët të operojnë me autonomi të plotë, të padenjë nga re. Sistemi i ri, i quajtur Gemini Robotics On-Device, shkon plotësisht në pajisjen lokale të një roboti, një zhvillim kritik që premton të bëjë sistemet robotike më të shpejtë, më të besueshëm dhe të aftë për të funksionuar në mjedise me lidhje intermittent ose pa internet. Kjo shënon një hap të rëndësishëm drejt bërjes së robotëve me qëllime të përgjithshme praktike për aplikimet e botës reale. Isshtë e para nga modelet e veprimit të gjuhës vizionale të kompanisë (VLA) që do të vihen në dispozicion për rregullimin e mirë, duke lejuar zhvilluesit që ta adaptojnë atë për detyra të reja, shumë të shkathëta me sa më pak nga 50 deri në 100 demonstrime. Kjo aftësi për të përgjithësuar nga një sasi e vogël e të dhënave të reja mund të përshpejtojë në mënyrë dramatike vendosjen e robotëve në ambiente komplekse. selektiv Programi i Testerit të besuar , cili zhvillues mund të aplikojë për përmes Google. Kjo pjesë e kontrolluar nënvizon rëndësinë strategjike të modelit si gara për të ndërtuar sisteme më të afta fizike AI intensifikohet midis laboratorëve të teknologjisë kryesore. AI
lëvizje është një hyrje e madhe në një debat pivotal duke formuar të ardhmen e të ardhmen e robotikës: nëse duhet të jetë në të ardhmen e së ardhmes së robotikës: nëse duhet të jetë në të ardhmen, nëse duhet të jetë në të ardhmen, nëse duhet të jetë, nëse ka të bëjë me të ardhmen, nëse duhet të jetë, nëse, në të, do të jetë,, nëse, është,, në të, të jetë, nëse, në të, do të jetë,, nëse ka,, nëse ka,, në mënyrë të drejtpërdrejtë. Përpunimi i pajisjes është thelbësor për robotikën në kohë reale sepse eliminon vonesën e rrjetit të natyrshëm në cloud computing. Për robotët që bashkëveprojnë me botën fizike, një vonesë e ndarë e dytë në vendimmarrje mund të jetë ndryshimi midis suksesit dhe dështimit. Kjo e bën AI lokale thelbësore për aplikimet ku përgjigjet e menjëhershme janë të panegociueshme. Kjo sfidë ka çuar në baste të ndryshme strategjike në të gjithë industrinë. Figura AI, për shembull, prezantoi modelin e tij të optimizuar të Helix AI në shkurt, i cili, si sistemi i ri i Google, shkon plotësisht në GPU të ngulitur. Strategjia e vetë Google ka evoluar; Platforma e saj e robotikës Binjakët e flamurit, e prezantuar në Mars, përdor një qasje hibride. Modeli i ri në pajisje ofron një zgjidhje të dedikuar për skenarët ku autonomia është parësore. Target=”_ bosh”> trefishuar në 2024 në 1.2 miliardë dollarë , duke sinjalizuar konkurrencë intensive. Sipas Federatës Ndërkombëtare të Robotikës , tregu global për instalimet industriale të robotit tashmë ka goditur një kohë të lartë prej 16.5 miliardë dollarë, me një çelës të rëndësishëm për 2025 duke qenë”AI MEDSIA”AI ME ME MARSS AI”AI ME ME MARSIS A”në vend se programim i ngurtë.
Ky peizazh konkurrues përfshin lojtarë kryesorë që ndjekin filozofi unike. Ndërsa Google dhe Figura AI Champion On-Device Speed, Meta kohët e fundit lëshoi V-Jepa 2, një”model botëror”me burim të hapur që mëson sensin fizik të përbashkët nga videoja. Këto modele lejojnë që një AI të drejtojë simulime të brendshme për të”menduar”para se të veprojë, duke lënë makinat”të planifikojnë lëvizjet dhe ndërveprimet në hapësirat e simuluara”përpara se t’i provojnë ato në botën fizike. Kjo metodë, e përqendruar në ndërtimin e një kuptimi të brendshëm të fizikës, ofron një rrugë tjetër drejt krijimit të robotëve që mund të lundrojnë në mjedise njerëzore të paparashikueshme. Kjo arrihet përmes një teknike të njohur si mësim pak të shotave (FSL), i cili lejon një model të mësojë nga një numër shumë i vogël shembujsh. Kjo qasje kërkon të të imitojë aftësinë e njeriut Për të kuptuar shpejt konceptet e reja, një kontrast i rreptë me modelet tradicionale të AI që shpesh kërkojnë miliona pika të të dhënave. Për robotikën, ku mbledhja e të dhënave të gjera, të etiketuara për çdo detyrë të mundshme është jopraktike, FSL është një ndërrues i lojës. Kompania siguroi prova konkrete për këtë përshtatje, duke vënë në dukje se ndërsa modeli fillimisht ishte trajnuar për robotët Aloha, ajo ishte përshtatur me sukses me një robot Bi-krah Franka FR3 dhe Robot Humanoid Apollo nga Apptronik.
kjo aftësi është ajo që mundëson potencialin më të gjerë të sistemit. Si Karolina Parada, Shefi i Robotikës në Google Deepmind, i shpjeguar në duke raportuar nga ARS Technica , fuqia gjeneruese e modelit përtej komandave të thjeshta.”Po vizaton nga kuptimi multimodal botëror i Binjakëve në mënyrë që të bëjë një detyrë plotësisht të re… Ajo që mundëson është në të njëjtën mënyrë Gemini mund të prodhojë tekst, të shkruajë poezi, thjesht të përmbledhë një artikull, ju gjithashtu mund të shkruani kod, dhe ju gjithashtu mund të gjeneroni imazhe. Ai gjithashtu mund të gjenerojë veprime robot.”SDK përmes një programi të kufizuar nxjerr në pah një qendër më të gjerë strategjike brenda DeepMind. Laboratori, dikur një bastion i botimit të hapur shkencor, tani më shumë selektivisht lëshon teknologjinë e tij thelbësore për të mbrojtur avantazhin konkurrues të Google. Kjo ndërrim raportohet se ka shkaktuar fërkime nga brenda, me një studiues
Ky qëndrim i pronarit bie në kundërshtim me rolin e Meta në AI me burim të hapur me modelet e saj Llama, një strategji e krijuar për të përshpejtuar inovacionin e komunitetit. Ndërsa kjo hapje është lavdëruar, performanca e modeleve të hapura ka gjurmuar historikisht homologët e tyre me burim të mbyllur. Modelet më të mira me burim të hapur kanë mbetur pas atyre të pronarit për disa muaj, megjithëse ai hendek po zvogëlohet. Ky ndryshim i performancës ndihmon në shpjegimin pse një kompani si Google do të ruajë teknologjinë e saj më të përparuar, edhe pse siguron mjete për zhvilluesit që të ndërtojnë mbi të. Ajo adreson drejtpërdrejt nevojën kritike të industrisë për sisteme autonome, ndërsa tregon përparime të jashtëzakonshme në mësimin e shpejtë, të ngjashëm me njeriun. Megjithatë, ndikimi përfundimtar i modelit do të formohet jo vetëm nga aftësia e tij teknike, por edhe nga tensioni strategjik midis frymës bashkëpunuese të kërkimit të hapur dhe realiteteve të mbrojtura të konkurrencës tregtare.