ChatGPT: el robot impulsado por IA de Microsoft

ChatGPT: el robot impulsado por IA de Microsoft

Los investigadores de Microsoft dieron a conocer un marco experimental la semana pasada para controlar drones y robots a través del lenguaje utilizando ChatGPT, un conocido modelo de lenguaje de IA desarrollado por OpenAI.

ChatGPT puede crear un código especializado que dirija el movimiento del robot mediante comandos dados en lenguaje natural. Luego, un humano revisa los resultados y realiza los ajustes necesarios hasta que la tarea se completa con éxito.

Los hallazgos se publicaron en el artículo "ChatGPT for Robotics: Design Principles and Model Abilities", escrito por Sai Vemprala, Rogerio Bonatti, Arthur Bucker y Ashish Kapoor del Grupo de Robótica y Sistemas Autónomos de Microsoft.

En un video de demostración, Microsoft muestra robots ensamblando bloques en el logotipo de Microsoft con un brazo robótico, usando un dron para escanear el contenido de un estante y usando un robot con visión para localizar objetos.

Estos robots parecen estar controlados por código creado por ChatGPT mientras obedecen comandos humanos.

Los investigadores le enseñaron a ChatGPT una API de robótica especial para que pudiera comunicarse con la robótica. ChatGPT puede generar código de control robótico de la misma manera que escribiría un poema o terminaría un ensayo cuando se le dan instrucciones como "recoger la pelota".

Un operador humano puede realizar la tarea y evaluar su desempeño después de revisar y editar el código para verificar su precisión y seguridad.

ChatGPT no es un sistema autónomo, pero acelera la programación de control robótico de esta manera. Como se indica en el documento, “Hacemos hincapié en que el uso de ChatGPT para la robótica no es un proceso totalmente automatizado, sino que actúa como una herramienta para aumentar la capacidad humana.

Si bien parece que los humanos brindan la mayoría de los comentarios de ChatGPT (en términos de la efectividad o el fracaso de sus acciones) en forma de texto, los investigadores también afirman que han tenido cierto éxito al proporcionar datos visuales a ChatGPT.

En un caso, los investigadores usaron ChatGPT para instruir a un robot para que atrapara una pelota de baloncesto mientras recibía información de una cámara. 

Los investigadores afirmaron que ChatGPT puede estimar cómo aparecerán la pelota y el cielo en la imagen de la cámara utilizando el código SVG.

Este comportamiento plantea la posibilidad de que el LLM mantenga un modelo del mundo que va más allá de las probabilidades basadas en texto.

Aunque los resultados en este punto parecen rudimentarios, muestran los primeros intentos de incorporar el control robótico con la tecnología más nueva, modelos de lenguaje grande. 

Microsoft afirma que una interfaz de ChatGPT puede hacer que la robótica sea accesible para un público más amplio en el futuro.

Para ayudar con las tareas de robótica, el objetivo de esta investigación es determinar si ChatGPT puede razonar sobre el mundo físico además del texto.

Queremos simplificar la interacción de las personas con los robots al eliminar la necesidad de que aprendan lenguajes de programación difíciles o detalles específicos sobre los sistemas robóticos.

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *