ChatGPT: робот Microsoft на основі штучного інтелекту

ChatGPT: робот Microsoft на основі штучного інтелекту

Минулого тижня дослідники Microsoft оприлюднили експериментальну структуру для керування дронами та роботами за допомогою мови за допомогою ChatGPT, відомої мовної моделі ШІ, розробленої OpenAI.

ChatGPT може створювати спеціалізований код, який керує рухом робота за допомогою команд, поданих природною мовою. Потім людина переглядає результати та вносить необхідні корективи, поки завдання не буде успішно виконано.

Висновки були опубліковані в статті «ChatGPT для робототехніки: принципи проектування та можливості моделі», написаній Сай Вемпралою, Роджеріо Бонатті, Артуром Бакером і Ашішем Капуром з Microsoft Autonomous Systems and Robotics Group.

У демонстраційному відео Microsoft показує, як роботи збирають блоки в логотип Microsoft за допомогою роботизованої руки, використовують дрон для сканування вмісту полиці та використовують робота з баченням для визначення місцезнаходження об’єктів.

Схоже, що цими роботами керує код, створений ChatGPT під час виконання команд людини.

Дослідники навчили ChatGPT спеціальному API для робототехніки, щоб він міг спілкуватися з робототехнікою. ChatGPT може генерувати код керування робототехнікою так само, як він написав би вірш або закінчив есе, отримавши інструкцію на зразок «підбери м’яч».

Людина-оператор може виконати завдання та оцінити його продуктивність після перегляду та редагування коду для забезпечення точності та безпеки.

ChatGPT не є автономною системою, але таким чином прискорює програмування роботизованого керування. Як зазначено в документі, «ми підкреслюємо, що використання ChatGPT для робототехніки не є повністю автоматизованим процесом, а скоріше діє як інструмент для збільшення потенціалу людини.

Хоча здається, що люди надають більшість відгуків ChatGPT (щодо ефективності чи невдачі його дій) у формі тексту, дослідники також стверджують, що вони досягли певного успіху, надаючи візуальні дані ChatGPT.

В одному випадку дослідники використовували ChatGPT, щоб наказати роботу зловити баскетбольний м’яч, отримуючи зворотний зв’язок від камери. 

Дослідники заявили, що ChatGPT може оцінити, як м'яч і небо будуть виглядати на зображенні камери за допомогою коду SVG.

Така поведінка підвищує ймовірність того, що LLM підтримує модель світу, яка виходить за рамки текстових ймовірностей.

Хоча результати на даний момент здаються рудиментарними, вони показують ранні спроби об’єднати роботизоване управління з новітніми технологіями, великими мовними моделями. 

Microsoft стверджує, що інтерфейс ChatGPT може в майбутньому зробити робототехніку доступною для більшої аудиторії.

Щоб допомогти у виконанні задач робототехніки, мета цього дослідження — визначити, чи може ChatGPT міркувати про фізичний світ на додаток до тексту.

Ми хочемо спростити людям взаємодію з роботами, усунувши з них потребу вивчати складні мови програмування або специфіку робототехнічних систем.

залишити коментар

Ваша електронна адреса не буде опублікований. Обов'язкові поля позначені * *