Logo Computerhoy.com

DeepMind de Google mejora el modelo de IA RoboCat y ahora puede hacer todo esto

RoboCat

Google DeepMind

El avance que puede suponer en el aprendizaje de tareas para los robots, con esta técnica avanzada de Google.

Si bien los robots en la actualidad pueden hacer multitud de tareas para facilitar la vida a los seres humanos, anteriormente se les ha tenido que enseñar a realizar distintas acciones gracias a los algoritmos previamente entrenados.

Esto requiere mucho tiempo, pero un reciente avance de Google podría hacer que ese paso inicial fuera mucho más leve o incluso inexistente, dando vida al robot del futuro.

Y Google DeepMind ha introducido un nuevo modelo de inteligencia artificial de automejora llamado RoboCat que podría autogenerar nuevos datos de entrenamiento para mejorar las distintas acciones de un robot sin mucha intervención humana.

RoboCat aprende mucho más rápido que otros modelos de última generación. Puede asumir una nueva tarea con tan solo 100 demostraciones porque se basa en un conjunto de datos grande y diverso. Esta capacidad ayudará a acelerar la investigación en robótica, ya que reduce la necesidad de capacitación supervisada por humanos y es un paso importante hacia la creación de un robot de propósito general”, afirman los investigadores.

Este nuevo avance se basa en el modelo multimodal “Gato”, capaz de procesar lenguaje, imágenes y acciones en cualquier tipo de entorno, tanto en los realistas como en los simulados.

Para ello hicieron uso de la arquitectura de Gato que viene ya con datos de entrenamiento de secuencia de imágenes y acciones de varios brazos robóticos donde se resuelven infinidad de situaciones y tareas distintas.

Los pasos del entrenamiento para RoboCat

Entrenaron al robot para aprender distintas tareas bajo los siguientes pasos.

  • Recopiló de 100 a 1000 demostraciones de nuevas tareas, usando un brazo robótico controlado por un ser humano.
  • Afinaron el desempeño del robot en esta tarea, creando un agente derivado.
  • Este agente derivado practicó esta nueva tarea un promedio de 10.000 veces generando así muchos más datos.
  • Luego se incorporaron los datos de la demostración y los autogenerados en el conjunto de datos de capacitación existentes de RoboCat.
  • Finalmente entrenaron la nueva versión de RoboCat en el nuevo conjunto de datos de entrenamiento.

Así que, con esto, se enseñó al modelo de inteligencia artificial a operar distintos brazos en pocas horas.

Si bien anteriormente había sido entrenado con brazos con pinzas de varias puntas, luego pudo adaptarse fácil a un brazo más complejo con una pinza de tres dedos y el doble de entradas controlables.

Y curiosamente, cuantas más tareas nuevas aprendió, mejor pudo aprender tareas adicionales.

Las primeras versiones de RoboCat de Google DeepMind tuvieron éxito solo el 36 % de las veces en tareas que nunca antes había probado, pero esta versión más avanzada duplicó esta tasa de éxito con las mismas tareas.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.