El gigante estadounidense de Google dio un paso significativo que revolucionará la inteligencia artificial (IA) aplicada a la robótica a través de dos nuevos modelos especializados basados en Gemini 2.0.

Se trata de Gemini Robotics y Gemini Robotics-ER, dos tecnologías que DeepMind aspira a convertirlas en el punto de partida de la próxima generación de robots útiles.

Google se centrará en tres puntos claves:

Si bien ambos modelos utilizan Gemini 2.0 como base, son robots distintos.

Gemini Robotics es un modelo de visión-lenguaje-acción cuya principal meta es la implementación de acciones físicas para controlar a los robots.

Gemini Robotics-ER es un modelo de visión-lenguaje que se enfoca en la comprensión espacial y en optimizar capacidades como el reconocimiento de objetos tridimensionales. 

Google apuesta por la IA en sus robots 

Entre las características más destacadas de Gemini Robotics-ER está su capacidad para aprender nuevas tareas en el momento.

Un ejemplo dado por Google muestra que si el robot ve una taza de café, la IA puede determinar de inmediato cómo agarrarla y cuál es la mejor forma de acercarse a ella.

Aunque estas tecnologías son clave para el desarrollo de robots humanoides, Google no se limitó solo a ellos.

Sus nuevos modelos de IA son compatibles con distintos tipos de robots, ya sea con agarre de manos y dedos o con diseños de pinza. 

A pesar de esta versatilidad, Google firmó una alianza con Apptronik, la empresa detrás del robot bípedo Apollo. El objetivo es continuar con el desarrollo de robots humanoides impulsados por Gemini 2.0.

Apptronik ya había sido noticia en 2024 tras asociarse con Mercedes-Benz para integrar su tecnología robótica en una fábrica de Hungría. Ahora, con el apoyo de Google, busca llevar sus desarrollos aún más lejos.

Te puede interesar