Google DeepMind ha introdotto Gemini Robotics e Gemini Robotics-ER, due modelli AI avanzati sviluppati per migliorare il modo in cui i robot apprendono e si adattano a compiti fisici con un allenamento minimo precedente.

costruito sull’architettura Gemini 2.0, i modelli integrati visivi, linguaggio e l’apprendimento dell’azione, posizionando DeepMind al primo piano di sviluppo. Il loro lancio riflette la crescente attenzione alle capacità di interazione del mondo reale nel settore dei modelli AI in evoluzione.

Abilitando l’adattabilità con AI multimodale

gemini robotics combina il riconoscimento visivo, la comprensione del linguaggio naturale e l’apprendimento dell’azione per consentire robot per elaborare ambienti complessi, istruzioni e eseguire tasks. altezza=”352″src=”Dati: immagine/svg+xml; nitro-empty-id=mtcxntoymduy-1; base64, pHn2zyb2awv3qm94psiwidagmtayncaznt IIIHDPZHROPSIXMDI0IIBOZWLNAHQ9IJM1MIIGEG1SBNM9IMH0DHA6LY93D3CUDZMUB3JNLZIWMDAVC3ZNIJ48L3N2zz4=”>

I modelli impiegano approcci di apprendimento a scatto zero e a pochi colpi, consentendo ai robot di gestire le attività senza una formazione precedente o di adattarsi rapidamente da esempi minimi. Questo approccio può aiutare industrie come la produzione e la logistica riducendo al minimo i cicli di allenamento e facilitando la rapida distribuzione di sistemi robotici.

Gemini Robotics-ER si basa su queste capacità migliorando il ragionamento spaziale e temporale. I robot che utilizzano questo modello possono analizzare gli ambienti 3D, prevedere le traiettorie degli oggetti e comprendere come gli oggetti interagiscono in uno spazio.

Il risultato è un sistema in grado di adattarsi a scenari dinamici e imprevedibili mantenendo la precisione operativa. La robotica risiede nella sua adattabilità in vari contesti operativi. I robot che utilizzano questi modelli possono passare tra compiti o adattarsi a nuovi ambienti con una riprogrammazione minima.

Ad esempio, un robot originariamente configurato per il gruppo di prodotti potrebbe adattarsi perfettamente all’assemblaggio di una linea di prodotto diversa, riducendo i costi di sviluppo e che consente di distribuire più rapide. Questa capacità multipiattaforma semplifica il processo di ridimensionamento per le aziende che integrano la robotica avanzata nelle loro operazioni, affrontando direttamente le sfide all’interno dei flussi di lavoro di automazione.

[contenuto incorporato]

sviluppi competitivi nella robotica. Nel dicembre 2024, la Carnegie Mellon University ha introdotto il Genesis Ai Simulator, che accelera l’addestramento robotico generando simulazioni complesse fino a 81 volte più veloce delle condizioni del mondo reale.

Genesis Physics AI Simulation Motore utilizzato per la generazione interattiva della scena 3D. (Fonte: Genesis github Page )

Genesis abilita la generazione di scenari dinamici da semplici istruzioni di testo, offrendo un approccio a basso rischio e efficiente e efficiente per perfezionare i comportamenti Ai-guida. reattività e adattabilità. Operando interamente su GPU incorporate, Helix consente ai robot di comprendere i comandi vocali, adattarsi a oggetti non familiari e collaborare in tempo reale, senza affidamento sui sistemi cloud. 

[contenuto incorporato]

Microsoft a febbraio ha annunciato il suo modello Magma AI, concentrandosi sul ponte dell’automazione del software con la robotica. Magma integra i dati di visione, linguaggio e azione per automatizzare i flussi di lavoro in ambienti industriali e aziendali, migliorando l’adattabilità e riducendo la complessità operativa.

Uso Esempi di casi per Magma AI (Fonte: Microsoft)

Nel frattempo, Meta si è concentrato sulla fornitura di tecnologie AI di base. All’inizio di febbraio l’azienda ha introdotto il modello Meta Motiva AI, progettato per migliorare la precisione e il movimento realistico in robotica. L’approccio di Meta supporta i produttori di terze parti nella costruzione di sistemi robotici avanzati.

screenshot Dalla demo interattivo Meta Motiva

guidando più velocemente lo sviluppo di AI

la simulazione è diventata una componente centrale dello sviluppo dell’IA, fornendo ambienti a basso rischio per perfezionare i comportamenti robotici. L’emulatore di Genesis consente ai ricercatori di creare scenari realistici da istruzioni di testo di base, accelerando l’adattamento di modelli di intelligenza artificiale come Gemini Robotics prima della distribuzione del mondo reale.

Ciò consente ai sistemi di intelligenza artificiale di ottimizzare le proprie azioni attraverso simulazioni ripetute, garantendo un comportamento migliorato in condizioni imprevedibili nel mondo reale. Per la robotica Gemelli, questa tecnica garantisce adattabilità e precisione su diversi compiti e ambienti.

Oltre agli approcci di formazione, anche le capacità di elaborazione in tempo reale stanno diventando un fattore determinante per la robotica avanzata. Il sistema di elica di Figura AI esemplifica questo utilizzando GPU incorporate per il processo decisionale locale, riducendo la latenza e consentendo la reattività immediata. Ciò è particolarmente cruciale in settori come la logistica, in cui la rapida adattabilità è essenziale per l’efficienza operativa.

La robotica Gemini di DeepMind impiega invece un ragionamento incorporato per consentire il processo decisionale consapevole del contesto. Ciò consente ai robot di adeguare il proprio comportamento in base ai dati ambientali in tempo reale, riducendo la necessità di istruzioni rigide e predefinite.

Tale adattabilità è essenziale per la distribuzione in ambienti dinamici in cui la flessibilità è un vantaggio competitivo.

le considerazioni etiche e le sfide dello sviluppo

Mentre modelli come Helix e Gemini Robotics possono migliorare l’adattabilità generale, i compiti che coinvolgono dilemmi etici o l’uso di oggetti fragili o irregolari continuano a testare il giudizio robotico, la precisione e l’accuratezza.

DeepMind sottolinea che la roboti di Gemini allinea Principi , concentrandosi sulla minimizzazione dei comportamenti non intenzionali e sulla garanzia che i robot possano interagire in sicurezza con gli ambienti umani.

Categories: IT Info