Mountain View apre un nuovo capitolo nell’intelligenza artificiale applicata alla robotica con il lancio di Gemini Robotics e Gemini Robotics-ER, due modelli progettati per rivoluzionare l’interazione tra umani e robot. Questi sistemi avanzati promettono di espandere enormemente le capacità dei robot, consentendo loro di affrontare compiti complessi nel mondo reale con un’efficienza mai vista prima.
Gemini Robotics: il modello che integra linguaggio, visione e azione
Il cuore dell’innovazione si chiama Gemini Robotics, un sofisticato sistema di IA multimodale che combina visione, comprensione linguistica e capacità d’azione. Questo modello consente ai robot di rispondere a comandi verbali espressi in linguaggio naturale, traducendo istruzioni complesse in azioni pratiche. Secondo quanto dichiarato da Google, Gemini Robotics è costruito sulle fondamenta del potente Gemini 2.0, dal quale eredita le funzionalità avanzate di ragionamento e interpretazione del linguaggio.
L’obiettivo di Gemini Robotics è permettere ai ricercatori e agli sviluppatori di controllare direttamente le azioni di diversi tipi di robot, sfruttando un sistema in grado di monitorare continuamente l’ambiente, rilevare variazioni e modificare i comportamenti in tempo reale. Questo approccio dinamico consente alle macchine di operare in ambienti domestici, luoghi di lavoro e spazi pubblici, svolgendo mansioni che vanno dal piegare origami all’incartare spuntini con estrema precisione.
Gemini Robotics-ER: comprensione spaziale per scenari complessi
Al fianco del primo modello, Google ha svelato Gemini Robotics-ER, una versione evoluta focalizzata sulla comprensione spaziale e sull’integrazione visiva. Questo sistema è progettato per migliorare l’interazione dei robot umanoidi con l’ambiente circostante, consentendo loro di prendere decisioni autonome in contesti in cui è essenziale valutare la posizione degli oggetti e le distanze. Gemini Robotics-ER è attualmente in fase di test grazie alla collaborazione con alcune delle più importanti aziende del settore, tra cui Apptronik, Agility Robots, Agile Robots, Boston Dynamics ed Enchanted Tools.
La sicurezza prima di tutto: nasce il dataset Asimov
Con l’introduzione di queste nuove tecnologie, Google affronta con decisione il tema della sicurezza nella robotica. I modelli Gemini Robotics sono progettati per valutare la pericolosità delle azioni prima di eseguirle, intervenendo solo quando il contesto garantisce l’assenza di rischi per le persone e per l’ambiente circostante. A supporto di questa missione, è stato lanciato anche il dataset Asimov, uno strumento che permetterà ai ricercatori di testare in modo rigoroso la sicurezza semantica delle decisioni robotiche.
Il dataset Asimov, secondo quanto affermato da Mountain View, contribuirà a misurare con precisione le implicazioni delle azioni dei robot nei contesti reali, rafforzando il controllo e l’affidabilità dei sistemi Gemini.
Collaborazioni per un futuro umanoide
Nell’ambito del programma di sviluppo, Google ha stretto partnership strategiche con leader dell’ingegneria robotica come Apptronik, specializzata in robot umanoidi, e altre realtà all’avanguardia, tra cui Boston Dynamics, celebre per i suoi robot dinamici e agili, e Agility Robotics, nota per lo sviluppo di robot bipedi. L’obiettivo condiviso è dare forma a una nuova generazione di assistenti robotizzati che sappiano collaborare con l’uomo in una gamma di applicazioni senza precedenti.
Secondo quanto dichiarato dai portavoce di Mountain View, questi sviluppi aprono le porte a un’era in cui la robotica avanzata non solo assisterà le persone nelle attività quotidiane, ma contribuirà anche a trasformare radicalmente il modo in cui si lavora e si vive negli ambienti del futuro.