A Google DeepMind egy új AI modellt mutatott be, amely lehetővé teszi a robotok teljes autonómiájának működését, a felhőből nem kötve. Az Gemini Robotics Device nevű új rendszer teljes egészében egy robot helyi hardverén fut, egy kritikus fejleményen, amely ígéri, hogy a robotrendszereket gyorsabbá, megbízhatóbbá és képes működni az internetkapcsolatú környezetben. Ez jelentős lépést jelent annak érdekében, hogy az általános célú robotok praktikussá váljanak a valós alkalmazásokhoz. Ez az első a vállalat látásnyelv-cselekvési (VLA) modelljei közül, amelyeket finomhangolásra lehet elérni, lehetővé téve a fejlesztők számára, hogy adaptálják azt új, nagyon ügyes feladatokhoz, akár 50-100 demonstrációval. Ez a képesség, hogy egy kis mennyiségű új adatból általánosítsa, drasztikusan felgyorsíthatja a robotok telepítését összetett beállításokban. Megbízható teszter program , mely fejlesztők alkalmazhatnak a Google-on keresztül. Ez az ellenőrzött bevezetés aláhúzza a modell stratégiai jelentőségét, mivel a nagyobb fizikai AI rendszerek felépítésének versenye fokozódik a fő technológiai laboratóriumok körében. Ai
A Google mozgatás A Clooth-on való ingadozásnak, vagy az intelligenciának, vagy annak mozgatása. Az eszközön történő feldolgozás elengedhetetlen a valós idejű robotika szempontjából, mivel kiküszöböli a felhőalapú számítástechnikában rejlő hálózati késleltetést. A fizikai világgal kölcsönhatásba lépő robotok esetében a döntéshozatal másodperces késleltetése lehet a különbség a siker és a kudarc között. Ez elengedhetetlenné teszi a helyi AI-t azokhoz az alkalmazásokhoz, ahol az azonnali válaszok nem tárgyalhatók. Ez a kihívás az iparágban eltérő stratégiai fogadásokhoz vezetett. Az AI. Ábra például februárban vezette be a robotika optimalizált Helix AI modelljét, amely-akárcsak a Google új rendszere-teljes egészében a beágyazott GPU-kon fut. A Google saját stratégiája fejlődött; A márciusban bevezetett Gemini Robotics Platform zászlóshajója hibrid megközelítést alkalmaz. Az új úti modell dedikált megoldást kínál a forgatókönyvek számára, ahol az autonómia kiemelkedően fontos. Target=”_ blank”> 2024-ben 1,2 milliárd dollárra hármasra emelkedett , jelezve az intenzív versenyt. A Robotika Nemzetközi Szövetsége szerint Az ipari robot-installációk globális piaca már a „Physy Ai”-a „Physy Ai”-a „Physy Ai”-a „Physy Ai”-a „Physy Asy”-a 2025-ös lényeges piacra, a 2025-ös “-a„ Physy Ai “-a„ Physy Ai “-a„ Physice “-a„ Physice “-a„ Physice “-a„ Physice “-a„ Physice “-a„ Physice “–a 2025-ös„ Ai “-a„ Physy Ai “–mint a merev programozás. Míg a Google és az AI ábra az AI AI Champion On Device Speed, a Meta nemrégiben kiadta a V-JEPA 2-et, egy nyílt forráskódú „világmodellt”, amely a videóból megtanulja a fizikai józanulmányt. Ezek a modellek lehetővé teszik az AI számára, hogy a belső szimulációk számára „gondolkodjon”, mielőtt az a cselekvés előtt „gondolkodni”, lehetővé téve a gépek „tervmozgásait és interakcióit a szimulált terekben”, mielőtt megpróbálnák őket a fizikai világban. Ez a fizika belső megértésére összpontosító módszer újabb utat kínál a robotok létrehozásához, amelyek kiszámíthatatlan emberi környezetet tudnak navigálni. Ezt egy néhány, néhány lövés tanulás (FSL) néven ismert technikával érik el, amely lehetővé teszi a modell számára, hogy nagyon kevés példából tanuljon. Ez a megközelítés a Emulálja az emberi képességet Az új fogalmak gyors megértése érdekében, amely szemmel tartja a hagyományos AI modelleket, amelyek gyakran adatpontokat igényelnek. A robotika esetében, ahol a hatalmas, címkézett adatkészletek gyűjtése minden lehetséges feladathoz nem praktikus, az FSL játékváltó. A társaság konkrét bizonyítékokat szolgáltatott erről az alkalmazkodóképességről, megjegyezve, hogy míg a modellt eredetileg az Aloha robotok számára képzették, az Apptronik által sikeresen adaptálták a Bi-Arm Franka FR3 robothoz és az Apollo humanoid robothoz. Amint Carolina Parada, a Google Deepmind robotika vezetője elmagyarázta a jelentést az Ars technika , a modell generáló hatalmán túl. „Ez a Gemini multimodális világ megértéséből származik, hogy egy teljesen új feladat elvégzése érdekében… ami lehetővé teszi, ugyanúgy, ahogyan az Ikrek szöveget készíthetnek, költészetet írhatnak, csak egy cikket foglalhatnak össze, a kódot is írhatsz, és képeket is előállíthat. Robot-műveleteket is előállíthat.”Az SDK egy korlátozott programon keresztül kiemeli a DeepMind szélesebb stratégiai forgatását. A laboratórium, amely egyszer a nyílt tudományos kiadvány bástyája, most szelektívebben bocsátja ki alaptechnikáját a Google versenyelőnyének védelme érdekében. Ez a váltás állítólag belsőleg súrlódást okozott, egy kutató
Ez a szabadalmaztatott álláspont élesen ellentétes a Meta szerepével a nyílt forráskódú AI-ben a láma modellekkel, egy olyan stratégiával, amelynek célja a közösségi innováció felgyorsítása. Miközben ezt a nyitottságot dicsérik, a nyitott modellek teljesítménye történelmileg nyomon követte a zárt forrású társaikat. A legjobb nyílt forráskódú modellek több hónappal elmaradtak a szabadalmaztatott termékektől, bár ez a rés csökken. Ez a teljesítménykülönbség segít megmagyarázni, hogy egy olyan vállalat miért őrzi a legfejlettebb technológiáját, még akkor is, ha eszközöket kínál a fejlesztők számára. Közvetlenül foglalkozik az iparág kritikus szükségességével az alacsony késleltetésű, autonóm rendszerekhez, miközben figyelemre méltó előrelépéseket mutat a gyors, emberszerű tanulásban. Ugyanakkor a modell végső hatását nemcsak a műszaki bátorság, hanem a nyitott kutatás együttműködési szelleme és a kereskedelmi verseny őrzött valósága közötti stratégiai feszültség is formálja.