Уява допомогла роботу управитися з інструментами

Американські інженери розробили алгоритм для роботів, що дозволяє їм використовувати інструменти для переміщення предметів. Під час навчання робот комбінує два підходи: експериментує, переміщуючи предмети випадковим чином, а також представляє за допомогою нейромережі, до якого результату призведе та чи інша дія. Експерименти з алгоритмом показали, що він дозволяє роботу ефективно використовувати прості інструменти, навіть якщо він бачить їх вперше, розповідають автори статті, опублікованої на arXiv.org.


При виконанні побутових дій люди часто користуються інструментами, що спрощують виконання завдання. При цьому ми здатні самостійно зрозуміти, чи варто застосовувати той чи інший інструмент у конкретній ситуації або ж можна обійтися своїми руками. Наприклад, збирати велику кількість дрібних предметів зручніше за допомогою совка, а підняти один легкий предмет простіше без нього. Всі ці маніпуляції здаються очевидними, проте для роботів сама концепція пересування одних предметів за допомогою інших є нетривіальною.


Група розробників під керівництвом Челсі Фін (Chelsea Finn) з Каліфорнійського університету в Берклі розробила алгоритм, що дозволяє роботам використовувати для переміщення одних об'єктів інші в якості інструментів, а також самостійно приймати рішення, чи оптимально застосовувати їх в поточній ситуації. Алгоритм дозволяє давати роботу задачу у вигляді візуальних маркерів, які стрілками показують, куди потрібно пересунути той чи інший предмет. Після цього алгоритм проводить розрахунки і управляє маніпулятором, який відстежує свої дії за допомогою камери.

В основі алгоритму лежить цікавий підхід: він планує можливі послідовності дій для маніпулятора, а потім віддає цей набір послідовностей нейромережі, яка синтезує відео, що відповідає кожній послідовності. Нейромережа бере попередній кадр і дію для поточного відрізка часу і видає у відповідь синтезований наступний кадр. Після цього алгоритм аналізує створені нейромережею відеозаписи і порівнює кінцеве розташування предметів на них із зображенням, на якому відображено завдання користувача. Потім він сортує їх на підставі того, наскільки близько результат відповідає завданню користувача. Після цього він відбирає кращі дії і планує їх заново таким чином, щоб вони були ближче до завдання. Нарешті, визначивши найкращу послідовність дій, робот виконує її, пересуваючи предмети.

Для навчання розробники поєднали два поширених підходи, що застосовуються у машинному навчанні - імітаційне навчання та навчання без вчителя. Під час імітаційного навчання розробники брали в руки маніпулятор і вручну показували роботу, як необхідно виконати дію за допомогою інструменту в конкретній ситуації. Під час кожного з таких сеансів робот записує завдання користувача, відео виконання дії та положення маніпулятора під час виконання. При навчанні без вчителя робот самостійно обирав дії випадковим чином. Завдяки цьому він отримав великий обсяг даних про взаємодію інструментів і предметів за допомогою навчання без учителя, але при цьому також побачив приклади оптимальних дій, яких він навряд чи досяг би за допомогою випадкового вибору. Крім того, автори також використовували записи виконання різних дій роботами з датасета BAIR Robot Interaction Dataset.

Експерименти показали, що робот у багатьох випадках здатний вистачати інструменти і пересувати предмети в задану область. Наприклад, він може взяти щітку і перемістити кілька предметів у совок за одну дію. Крім того, експерименти показали, що в деяких випадках робот розуміє, що оптимальніше виконати завдання без інструменту - за допомогою тільки власного маніпулятора. Нарешті, автори зазначають, що робот показав досить високий рівень генералізації і зміг використовувати інструменти нового для себе типу, що не зустрічалися йому під час навчання.

Торік інша група американських інженерів навчила модульного робота використовувати підручні інструменти. Наприклад, він здатний самостійно оцінити обстановку, зрозуміти, що він не може забратися на перешкоду, і піднести до нього похилий пандус. А інша група інженерів з Каліфорнійського університету в Берклі нещодавно навчила робота з двома захопленнями різних типів визначати, який з них оптимальніше застосувати для поточного завдання.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND