ChatGPT: o robô alimentado por IA da Microsoft

ChatGPT: o robô alimentado por IA da Microsoft

Pesquisadores da Microsoft revelaram na semana passada uma estrutura experimental para controlar drones e robôs por meio de linguagem usando ChatGPT, um conhecido modelo de linguagem de IA desenvolvido pela OpenAI.

ChatGPT pode criar código especializado que direciona o movimento do robô usando comandos dados em linguagem natural. Um ser humano então analisa os resultados e faz os ajustes necessários até que a tarefa seja concluída com êxito.

As descobertas foram publicadas no artigo “ChatGPT for Robotics: Design Principles and Model Abilities”, escrito por Sai Vemprala, Rogerio Bonatti, Arthur Bucker e Ashish Kapoor do Microsoft Autonomous Systems and Robotics Group.

Em um vídeo de demonstração, a Microsoft mostra robôs montando blocos no logotipo da Microsoft com um braço robótico, usando um drone para escanear o conteúdo de uma prateleira e usando um robô com visão para localizar objetos.

Esses robôs parecem ser controlados por código criado pelo ChatGPT enquanto obedecem a comandos humanos.

Os pesquisadores ensinaram ao ChatGPT uma API robótica especial para que ele pudesse se comunicar com a robótica. O ChatGPT pode gerar código de controle robótico da mesma forma que escreveria um poema ou terminaria uma redação ao receber instruções como “pegue a bola”.

Um operador humano pode realizar a tarefa e avaliar seu desempenho após revisar e editar o código para obter precisão e segurança.

ChatGPT não é um sistema autônomo, mas dessa forma acelera a programação do controle robótico. Conforme afirmado no artigo, “Enfatizamos que o uso do ChatGPT para robótica não é um processo totalmente automatizado, mas atua como uma ferramenta para aumentar a capacidade humana.

Embora pareça que os humanos fornecem a maior parte do feedback do ChatGPT (em termos da eficácia ou fracasso das suas ações) na forma de texto, os investigadores também afirmam que tiveram algum sucesso ao fornecer dados visuais ao ChatGPT.

Em um caso, os pesquisadores usaram o ChatGPT para instruir um robô a pegar uma bola de basquete enquanto recebia feedback de uma câmera. 

Os pesquisadores afirmaram que o ChatGPT pode estimar como a bola e o céu aparecerão na imagem da câmera usando o código SVG.

Este comportamento levanta a possibilidade de que o LLM mantenha um modelo de mundo que vai além das probabilidades baseadas em texto.

Embora os resultados neste momento pareçam rudimentares, eles mostram tentativas iniciais de incorporar o controle robótico com a tecnologia mais recente, grandes modelos de linguagem. 

A Microsoft afirma que uma interface ChatGPT poderá, no futuro, tornar a robótica acessível a um público maior.

Para auxiliar nas tarefas de robótica, o objetivo desta pesquisa é determinar se o ChatGPT pode raciocinar sobre o mundo físico além do texto.

Queremos tornar mais simples a interação das pessoas com robôs, eliminando a necessidade de aprenderem linguagens de programação difíceis ou detalhes específicos sobre sistemas robóticos.

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *