Нейросетева годівниця автоматизувала дресирування собак

Американські розробники зібрали апарат для напівавтоматичного дресирування собак. Наприклад, після команди «сидіти» пристрій розпізнає за допомогою нейромережі положення собаки і, якщо він відповідає команді, видає їй ласощі. Стаття про розробку опублікована на arXiv.org.


При дресируванні собак господарі або тренери зазвичай використовують метод навчання з підкріпленням, тобто тим чи іншим чином винагороджують тварину за бажану поведінку, наприклад, даючи їй ласощі. Цей метод не тільки гуманніший за метод навчання через покарання, а й, як показують дослідження, ефективніший, а також викликає у собак менший стрес під час навчання. Оскільки процес навчання принципово простий (необхідно оцінити дію собаки і дати або не дати нагороду), його можна автоматизувати і деякі дослідники вже створювали подібні алгоритми.


Джейсон Сток (Jason Stock) і Том Кейві (Tom Cavey) з Університету штату Колорадо створили алгоритм, адаптований для роботи на недорогому одноплатному комп'ютері, і апарат для дресирування, який самостійно видає собаці частування за правильні дії. Вони використовували комп'ютер NVIDIA Jetson Nano, у якого є потужний відеоускорювач, що підходить для виконання нейромережевих алгоритмів. До нього вони також під'єднали камеру і саморобний дозатор, який привідкриває відсік з кормом, щоб звідти висипалася порція частування в якості нагороди. Автори не зазначили в статті, як саме дається команда, і не перерахували динамік у списку обладнання, так що, мабуть, цю частину роботи все ж виконує людина і роботу апарату не можна назвати повністю автоматичною.

Розробники використовували три поширені команди: «сидіти», «стояти» і «лежати». Для їх розпізнавання вони випробували різні модифікації трьох згорточних нейромереж: ConvNet, MobileNetV2 і EfficientNet, а після навчання випробували квантування («стиснення» нейромережі за рахунок перетворення чисел з плаваючою комою в цілі, детальніше можна прочитати тут) за допомогою TensorFlow і TensorRT.

Для навчання нейромережевих моделей автори скористалися датасетом Stanford Dog Dataset і самостійно розбили кадри з нього на чотири групи, що відповідають трьом бажаним положенням собак і одному типу з невизначеним положенням. В результаті вони отримали набір з 20578 фотографій з різними собаками, зроблених в різних оточеннях і при різному освітленні.

Навчивши безліч комбінацій нейромереж і методів квантування, вони визначили два оптимальних варіанти, один з яких видає високу точність і швидкість роботи, а другий оптимізований для ефективного використання пам'яті. Перший варіант - це нейромережа EfficientNetB0, оптимізована за допомогою TensorRT. Вона показує точність 90,75 відсотків і працює з частотою 36,28 кадру в секунду, займаючи 28,34 мегабайта. Другий варіант - MobileNetV2, оптимізована за допомогою TensorFlow. Вона має точність 87,57 відсотка і займає всього 4,48 мегабайт пам'яті, але працює з частотою 9,38 кадра в секунду.

Надалі розробники пропонують додати до алгоритму нейромережу для розпізнавання об'єктів, щоб він міг визначати положення хвоста, лап та інших частин тіла.

Дресирування можна використовувати не тільки для домашніх вихованців. У 2017 році нідерландські інженери створили розумну годівницю для ворон і воронів, яка видає їжу тільки в обмін на сигаретні недопалки - так вони запропонували боротися зі сміттям на вулицях.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND