ChatGPT: il robot basato sull'intelligenza artificiale di Microsoft

ChatGPT: il robot basato sull'intelligenza artificiale di Microsoft

I ricercatori Microsoft hanno presentato la scorsa settimana un framework sperimentale per controllare droni e robot attraverso il linguaggio utilizzando ChatGPT, un noto modello linguistico di intelligenza artificiale sviluppato da OpenAI.

ChatGPT può creare codice specializzato che dirige il movimento del robot utilizzando comandi impartiti in linguaggio naturale. Un essere umano quindi esamina i risultati e apporta le modifiche necessarie fino a quando l’attività non viene completata con successo.

I risultati sono stati pubblicati nel documento “ChatGPT for Robotics: Design Principles and Model Abilities”, scritto da Sai Vemprala, Rogerio Bonatti, Arthur Bucker e Ashish Kapoor del Microsoft Autonomous Systems and Robotics Group.

In un video dimostrativo, Microsoft mostra i robot che assemblano i blocchi nel logo Microsoft con un braccio robotico, utilizzano un drone per scansionare il contenuto di uno scaffale e utilizzano un robot dotato di visione per individuare gli oggetti.

Questi robot sembrano essere controllati dal codice creato da ChatGPT mentre obbediscono ai comandi umani.

I ricercatori hanno insegnato a ChatGPT una speciale API di robotica in modo che potesse comunicare con la robotica. ChatGPT può generare codice di controllo della robotica nello stesso modo in cui scriverebbe una poesia o finirebbe un saggio quando vengono fornite istruzioni come "raccogliere la palla".

Un operatore umano può eseguire l'attività e valutarne le prestazioni dopo aver esaminato e modificato il codice per verificarne l'accuratezza e la sicurezza.

ChatGPT non è un sistema autonomo, ma in questo modo accelera la programmazione del controllo robotico. Come affermato nel documento, “Sottolineiamo che l’uso di ChatGPT per la robotica non è un processo completamente automatizzato ma agisce piuttosto come uno strumento per aumentare la capacità umana.

Anche se sembra che gli esseri umani forniscano la maggior parte del feedback di ChatGPT (in termini di efficacia o fallimento delle sue azioni) sotto forma di testo, i ricercatori affermano anche di aver avuto un certo successo nel fornire dati visivi a ChatGPT.

In un caso, i ricercatori hanno utilizzato ChatGPT per istruire un robot a prendere un pallone da basket mentre riceveva feedback da una telecamera. 

I ricercatori hanno affermato che ChatGPT può stimare come appariranno la palla e il cielo nell'immagine della telecamera utilizzando il codice SVG.

Questo comportamento aumenta la possibilità che il LLM mantenga un modello del mondo che va oltre le probabilità basate sul testo.

Sebbene i risultati a questo punto sembrino rudimentali, mostrano i primi tentativi di incorporare il controllo robotico con la tecnologia più recente e modelli linguistici di grandi dimensioni. 

Microsoft sostiene che un'interfaccia ChatGPT potrebbe in futuro rendere la robotica accessibile a un pubblico più vasto.

Per assistere nei compiti di robotica, lo scopo di questa ricerca è determinare se ChatGPT può ragionare sul mondo fisico oltre al testo.

Vogliamo rendere più semplice per le persone interagire con i robot eliminando la necessità di apprendere linguaggi di programmazione difficili o specifiche sui sistemi robotici.

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *