Нейромережа відучили від сексизму

Американські дослідники розробили метод, який, на їхню думку, допоможе позбавити автоматичне розпізнавання зображень від упередженого ставлення до статі. Їх алгоритм працює за допомогою обмежень, які накладаються на роботу нейромережі, і може знижувати «сексизм» на 47,5 відсотків. Стаття доступна для прочитання на сайті Вашингтонського університету.


Автоматичне розпізнавання зображень з подальшою мовною розміткою використовується в багатьох технологіях, включаючи сучасні смартфони. У всіх систем комп'ютерного зору, однак, є істотний недолік: навчаючись на певній, часто обмеженій, вибірці зображень, нейромережа може працювати некоректно і упереджено щодо окремих представників суспільства.


Автори нової роботи перевірили роботу двох алгоритмів: MLC, який розмічає об'єкти зображення, і vSRL, який приписує об'єктам зображення їх семантичні ролі та дії. Результати роботи цих двох нейромереж показали, що 45 відсотків всіх дій і 37 відсотків об'єктів при розпізнаванні зміщуються в бік будь-якої статі сильніше, ніж в два рази. Проаналізувавши використовувані при навчанні бази даних зображень, дослідники з'ясували, що в imSitu, яка використовується при навчанні vSRL, кількість зображень з жінками в два рази перевершує кількість зображень з чоловіками в такій же ситуації. Це призводить до того, що тільки 16 відсоткам всіх зображень з підготовлюваними людьми приписується агенс-чоловік. Через таке зміщення в бік однієї статі нейромережа може працювати некоректно.

Для вирішення цієї проблеми дослідники розробили алгоритм, що позбавляє штучний інтелект від «гендерних упереджень» при розпізнаванні зображень. Цей алгоритм ґрунтується на обмеженні, відповідно до якого об'єкти та дії на зображеннях у тренувальній вибірці співвідносяться із суб'єктом певної статі не частіше, ніж у навчальній вибірці. Тобто, якщо кількість зображень чоловіків на кухні в навчальній вибірці дорівнює кількості зображень жінок на кухні, то до дії «готувати» або предмету «ложка» нейромережа повинна приписувати чоловіка так само часто, як і жінку.

Алгоритм працює за допомогою методу обмеженої оптимізації. Спочатку алгоритм розраховує зміщення в бік однієї з статей, ґрунтуючись на розподілі об'єктів однієї статі в навчальній вибірці і такому ж розподілі в результатах його роботи. Якщо зсув існує, алгоритм накладає відповідні обмеження на його роботу. У результаті дослідникам вдалося зменшити упередженість щодо статі в роботі нейромережі, яка розмічає семантичні ролі, на 40,5 відсотків, а нейромережі, яка розмічає об'єкти на фотографії - на 47,5 відсотків.

Автори роботи стверджують, що їх алгоритм здатний істотно зменшити упередженість по відношенню до статі, яка може проявлятися в роботі нейромережі, навченої на певній вибірці. Алгоритм обмеження при цьому не зменшує точність розпізнавання зображень.

Розробники систем комп'ютерного зору використовують і інші методи оптимізації роботи своїх алгоритмів. Так, у нашій замітці ви можете дізнатися про те, як дослідники вирішили проблему некоректного розпізнавання фотографій облич, прикритих рукою.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND