; Uusi järjestelmä, nimeltään Gemini-robotiikka laitteessa, toimii kokonaan robotin paikallisessa laitteistossa, kriittisessä kehityksessä, joka lupaa tehdä robottijärjestelmistä nopeampia, luotettavampia ja kykeneviä toimimaan ympäristöissä ajoittaisilla tai ilman Internet-yhteyksiä. Tämä merkitsee merkittävää askelta kohti yleistä käyttörobotien tekemistä käytännöllisille reaalimaailman sovelluksille.

Google DeepMind selittää, että bi-käsivarren roboteille suunniteltu uusi malli ei ole vain tehokas, vaan myös erittäin mukautuva ja suunniteltu vaatimaan minimaalisia laskennallisia resursseja. Se on ensimmäinen yrityksen visio-kielen (VLA) malleista, jotka on saatavana hienosäätöön, jolloin kehittäjät voivat mukauttaa sitä uusiin, erittäin tapeisiin tehtäviin, joissa on jopa 50–100 demonstraatiota. Tämä kyky yleistää pienestä määrästä uutta tietoa voisi dramaattisesti nopeuttaa robotien käyttöönottoa monimutkaisissa asetuksissa.

Tämän helpottamiseksi yritys julkaisee Gemini-robottics sdk Github, selektiivisen Luottamustesteriohjelman , jota kehittäjät voivat hakea. Tämä hallittu käyttöönotto korostaa mallin strategista merkitystä, kun kilpailu rakentaa paremmin kykenevämpiä fyysisiä AI-järjestelmiä voimistuu suurten teknisten laboratorioiden keskuudessa.

Move on suuri sisäänpääsy tai tiedustelupalvelu, joka on suorassa pivotal-keskustelussa. kone. Laitteen käsittely on ratkaisevan tärkeää reaaliaikaiselle robotiikalle, koska se eliminoi pilvipalvelulle ominaisen verkon latenssin. Fyysisen maailman kanssa vuorovaikutuksessa oleville roboteille sekunnin sekunnin viive päätöksenteossa voi olla ero menestyksen ja epäonnistumisen välillä. Tämä tekee paikallisesta AI: stä välttämättömän sovelluksissa, joissa välittömät vastaukset eivät ole neuvoteltavissa.

Pääasiallinen kompromissi laitteessa AI on kuitenkin paikallisen laitteiston luontainen rajoitus, jolla on vähemmän laskentavoimaa ja tallennustilaa kuin valtavat pilvipalvelimet. Tämä haaste on johtanut erilaisiin strategisiin vedonlyönteihin koko teollisuudessa. Esimerkiksi kuvio AI esitteli helmikuussa robotiikan optimoidun Helix AI-mallin, joka, kuten Googlen uusi järjestelmä, toimii täysin sulautetuilla GPU: lla.

Sitä vastoin Microsoftin Magma AI-malli on suunniteltu syvälle integraatiolle Azure Cloud-alustaan, kohdistaen yritysautomaatiota, missä liitettävyys on luotettavampi. Googlen oma strategia on kehittynyt; Sen lippulaiva Gemini-robotiikkaalusta, joka on esitelty maaliskuussa, käyttää hybridi-lähestymistapaa. Uusi laitemalli tarjoaa omistetun ratkaisun skenaarioihin, joissa autonomia on ensiarvoisen tärkeää.

Fyysisen älykkyyden tungosta

Venture Capital Investment-teollisuuden humanoidirobotiikkaan kolminkertaistui vuonna 2024-1,2 miljardia dollaria , mikä merkitsee voimakasta kilpailua. Robotiikan kansainvälisen liiton mukaan Kokemus kuin jäykän ohjelmointi. Vaikka Google ja Figum AI-mestari laitteiden nopeudella, Meta julkaisi äskettäin V-JEPA 2: n, avoimen lähdekoodin “maailmanmallin”, joka oppii videon fyysisen järjen. Nämä mallit antavat AI: lle mahdollisuuden suorittaa sisäisiä simulaatioita”ajatella”ennen sen toimintaa, antaen koneiden”suunnitella liikkeitä ja vuorovaikutuksia simuloiduissa tiloissa”ennen kuin yritetään niitä fyysisessä maailmassa.

Tämä lähestymistapa vähentää dramaattisesti kallista kokeilua ja virheitä ja kiihdyttää oppimista teollisuuskokoonpanossa ja logistiikassa. Tämä menetelmä, joka keskittyy fysiikan sisäisen ymmärryksen rakentamiseen, tarjoaa toisen polun luoda robotteja, jotka voivat navigoida arvaamattomien ihmisten ympäristöissä.

robottien opettamista oppimaan kuten ihmiset

Googlen uuden mallin ytimessä on keskittyminen-kyky suorittaa uusia tehtäviä minimaalisella koulutuksella. Tämä saavutetaan tekniikalla, joka tunnetaan nimellä muutaman kuvan oppiminen (FSL), jonka avulla malli voi oppia hyvin pienestä määrästä esimerkkejä. Tällä lähestymistavalla pyritään emuloi ihmisen kykyjä Robotiikan kannalta, jos laaja, merkittyjen tietojoukkojen kerääminen jokaiselle mahdolliselle tehtävälle on epäkäytännöllistä, FSL on pelinvaihtaja.

Google väittää, Yhtiö tarjosi konkreettisia todisteita tästä sopeutumiskyvystä ja huomautti, että vaikka malli alun perin koulutettiin Aloha-roboteille, se oli onnistuneesti mukautettu Apptronikin Bi-Arm Franka FR3-robottiin ja Apollon humanoidirobottiin.

Tämä kyky mahdollistaa järjestelmän laajemman potentiaalin. Kuten Google DeepMindin robotiikan päällikkö Carolina Parada, selitetty Raportointi ARS Technicasta , mallin geneenisylejä laajentaa yksinkertaista komentoa. “Se piirtää Geminin multimodaalista maailman ymmärrystä tehdäkseen täysin uuden tehtävän… mikä mahdollistaa samalla tavalla, että Kaksoset voivat tuottaa tekstiä, kirjoittaa runoutta, vain tiivistää artikkelin, voit myös kirjoittaa koodia ja voit myös luoda kuvia. Se voi myös luoda robottitoimintoja.”Rajoitetun ohjelman kautta SDK korostaa laajempaa strategista kääntöä Deepmindissä. Laboratorio, kerran avoimen tieteellisen julkaisun bastioni, julkaisee nyt selektiivisemmin ydinteknologiansa Googlen kilpailuetua. Tämä muutos on ilmoitettu aiheuttaneen kitkaa sisäisesti yhdellä tutkijoilla TOTEUTTAA TOIMINTA ,”Oletusarvo.”

Tämä omistusasenne on ristiriidassa META: n roolissa avoimen lähdekoodin AI: n kanssa sen LLAMA-malleilla, strategialla, joka on suunniteltu nopeuttamaan yhteisön innovaatioita. Vaikka tätä avoimuutta kiitetään, avoimien mallien suorituskyky on historiallisesti jäljittänyt suljetun lähdekoodin kollegansa. Parhaat avoimen lähdekoodin mallit ovat jääneet omistusoikeudellisiin malleihin useita kuukausia, vaikka tämä aukko kutistuu. Tämä suorituskykyero auttaa selittämään, miksi Googlen kaltainen yritys vartioi edistyneintä tekniikkaaan, vaikka se tarjoaa työkaluja kehittäjille sen rakentamiseksi.

Google-Gemini-robotiikan julkaisu laitteessa on laskettu siirto korkean panoksen kilpailussa seuraavan älykkään koneiden sukupolven rakentamiseksi. Se käsittelee suoraan alan kriittistä tarvetta matalalla viiveellisille, itsenäisille järjestelmille, samalla kun se esittelee huomattavaa edistystä nopeassa, ihmisen kaltaisessa oppimisessa. Kuitenkin mallin lopullinen vaikutus muotoilee paitsi sen tekninen kyky, myös strateginen jännitys avoimen tutkimuksen yhteistyöhön ja kaupallisen kilpailun vartioidun todellisuuden välillä. 

Categories: IT Info