Робот самостійно навчився тримати пістолет

Дослідники з університету Карнегі - Меллона в Піттсбурзі за допомогою нейронних мереж організували промисловому роботу Baxter самостійне навчання із захоплення маніпулятором різних об'єктів. Препринт опублікований на arXiv.org, коротко про роботу пише MIT Technology Review.


Для навчання перед роботом встановили стіл, заповнений різними предметами, серед яких були іграшкові пістолети, пластикова пляшка, пульт дистанційного керування телевізором і моток скотчу. Робот відкладав один з предметів убік, визначав найбільш вигідну точку захоплення і починав намагатися його брати з різних сторін. Для кожної обраної зони захоплення Baxter робив 188 спроб, після кожної з яких намагався підняти предмет, щоб перевірити успішність захоплення. Після фіксації результату захоплення робот клав об'єкт на стіл, маніпулятор повертався на 10 градусів і спроба повторювалася.


Після закінчення першої стадії навчання дослідники повторили цикл, представивши роботу новий набір предметів, з яких лише деякі були знайомі нейромережі за попередніми спробами. На навчання пішло 700 годин, протягом яких робот вчився піднімати предмети зі столу. Якщо предмет падав з маніпулятора, Baxter просто переходив до наступного предмета. Всього за час навчання робот виконав близько 50 тисяч захоплень предметів на столі.

Точність передбачення правильно обраної позиції маніпулятора для захоплення після навчання склала 80 відсотків. Як зазначають автори, інші методи вибору місця захоплення, засновані тільки на розпізнаванні об'єктів, справляються в 62 відсотках випадків. Дослідники вважають, що їхня робота допоможе при використанні роботів у складних умовах, де потрібне вміння адаптуватися до навколишнього середовища і умов поставленого завдання.

Робот Baxter володіє класичною для багатоцільового промислового робота компонуванням з двох маніпуляторів і передбачений набір датчиків для відстеження змін у навколишньому середовищі. Робот управляється операційною системою для роботів (ROS) з відкритим вихідним кодом, завдяки чому для дослідницьких проектів з машинним навчанням часто вибирають саме Baxter. Наприклад, саме цю модель робота дослідники навчили розпізнавати предмети на дотик і піч млинці.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND