Пінг-понг-бот: Старанний учень

Технології 01 грудня 2023

Робот освоює навички поводження з кулькою і ракеткою. Для цього «вчителю» необхідно лише показати йому приклад - і після кількох пробних спроб учень починає досить успішно справлятися з поставленим завданням.

Програмування роботів для виконання певних завдань залишається непростою справою, незважаючи на вражаючі успіхи робототехніки. А в непромислових умовах (у будинках, лікарнях, офісах) ситуація ускладнюється ще й необхідністю діяти більш безпечно в умовах більшої невизначеності. Тому інженери прагнуть створити роботів, поведінка яких буде гнучкою та адаптивною - роботів, які, подібно до людей, навчатимуться на власному досвіді.

Саме це завдання і вирішує команда дослідників з Robot Learning Lab (лабораторії, що входить до складу Інституту Макса Планка, Німеччина) на чолі з Яном Пітерсом (Jan Peters). Пітерс ставить перед собою мету перетворити програмування роботів на навчання. Іншими словами, він хоче розробити роботів, кожен рух яких не доведеться точно прораховувати.

На відео Катаріна Мулінг (Katharina Muelling), аспірант Пітерса, показує роботу, як «вести» кульку для пінг-понгу, закріплену на гумці. Робот представляє рухи у вигляді набору базових «моторних навичок» - і швидко «вчиться» цьому нехитрому трюку. Для порівняння, вчені спробували скласти програму для виконання того ж завдання. На це пішло цілих три місяці, і результат був не настільки хороший, як після «навчання», яке зайняло менше години.

У другій частині відео Мулінг вчить робота ловити кульку за допомогою чашки. Це набагато складніша навичка, і роботу для досягнення позитивного результату недостатньо просто наслідувати рухи людини. Різниця у швидкості переміщення руки і маніпулятора не дозволяє роботу зловити кульку при спробі відтворити дії «вчителя». І тут, за словами Пітерса, на перший план виходить процес «самовдосконалення». "Щоразу, коли роботу вдається підвести м'яч ближче до чашки, він отримує" нагороду ", - розповідає Пітерс. У результаті «самовдосконалення» протягом багатьох спроб робот освоює необхідні навички. Так, перші вдалі кидки припадають на 40-45 спроби, а після 90-95 спроб робот домагається стабільного позитивного результату.

Яка здатність роботи до навчання в порівнянні з людиною? Цим питанням задався Єнс Кобер (Jens Kober), один з аспірантів Пітерса. Як об'єкти невеликого експерименту він вибрав своїх численних родичів. Виявилося, наймолодші з них (віком до 6 років) взагалі не здатні зловити кульку в чашку, ті, що трохи старші (10-12 років), навчилися цьому за 30-35 спроб, а дорослі впоралися набагато швидше. «Керівник проекту - мабуть, єдина людина в лабораторії, хто так і не освоїв цю гру», - усміхається д-р Пітерс.

У заключній частині відео робот навчається грі в пінг-понг. Основне завдання тут полягає в модифікації раніше вивчених рухів залежно від візуальної інформації (напрямку польоту м'яча, випущеного з машини, що подає). Д-р Пітерс розраховує, що одного разу «пінг-понг-бот» якщо і не стане чемпіоном, то, принаймні, зможе обіграти всіх співробітників лабораторії.

За повідомленням IEEE Spectrum