Глибоке навчання залучили до розпізнавання зразків у гербаріях

Вчені з Технологічного інституту Коста-Ріки представили метод автоматичного розпізнавання рослин за зображеннями гербаріїв. Їх алгоритм, створений за допомогою методів глибокого навчання, був навчений на 400 тисячах зображень рослин, що мешкають на території Коста-Ріки та Франції, може правильно ідентифікувати рослини в 90 відсотках випадків. Стаття з дослідженням опублікована в журналі.


Збір рослин з метою їх подальшого висушування використовується ботаніками для систематичного вивчення рослин вже кілька століть. У світі налічується близько трьох тисяч великих гербаріїв в яких зберігаються близько 350 мільйонів зразків різних рослин, проте значна їх частина залишається невизначеною. Алгоритми для допомоги дослідникам у визначенні невідомих видів рослин вже давно розробляються: наприклад, програма LeafSnap може визначати рослини з території Північної Америки за знімком листа. Однак, всі відомі на сьогоднішній день програми з автоматичного визначення рослин були розроблені з використанням невеликих баз даних, через що точність їх роботи сильно обмежена.


У своїй новій роботі дослідники представили алгоритм автоматичного розпізнавання рослин за допомогою комп'ютерного зору. Їх технологія створена на основі згорточної нейромережі (англ. convolutional neural network, коротко CNN), яка відповідає за автоматичну обробку зображень з метою вичленувати певні характеризуючі його патерни (наприклад, колір або форму зображеного об'єкта).

Для тренування і тестування нейромережі були використані п'ять баз даних: дві бази даних містили відскановані зображення рослин з гербаріїв, дві - зображення живих рослин в природі і відсканованого листя і ще одна база даних (один мільйон зображень, узятих з ImceNet) була використана для попереднього тренування і не пов'язана з рослинами. Всього дослідники зібрали близько 400 тисяч зображень більш ніж трьох тисяч різних видів рослин.

У результаті нейромережа, попередньо навчена тільки на зображеннях гербаріїв, навчилася визначати рослини за зображеннями гербаріїв з точністю в 90 відсотків. Попереднє навчання на базі даних зображень гербаріїв дозволило нейромережі визначити зображення рослин у полі з точністю 66 відсотків. Крім того, дослідники протестували автоматичне визначення рослин на гербаріях з однієї місцевості (Франції) на базі даних гербаріїв іншого регіону (Коста-Ріки): нейромережа навчилася коректно вирішувати таке завдання з точністю до 87 відсотків.

Автори наголошують на важливості використання методів глибокого навчання у вирішенні завдань комп'ютерного зору взагалі та ідентифікації біологічних об'єктів зокрема і сподіваються, що їхня робота допоможе в розробці автоматичних методів розпізнавання біологічних особин.

Комп'ютерний зір допомагає користувачам автоматично визначати зовсім різні об'єкти. Наприклад, додаток Smartify може визначити картину за фотографією і надати про неї всю інформацію, а нещодавно система розпізнавання осіб вперше допомогла затримати злочинця.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND