Нейромережа прочитала першу книгу про Гаррі Поттера і розкрила секрет Дурслей

Програмісти з канадської компанії Maluuba розробили алгоритм, що дозволяє знаходити відповіді на питання в незнайомому тексті. Програму, побудовану на нейронній мережі, протестували на книзі «Гаррі Поттер і Філософський камінь», частка правильних відповідей склала вище 70 відсотків. Відео з тестом програми опубліковано на офіційному каналі компанії на Youtube, подробиці про алгоритм повідомляє MIT Technology Review.


Алгоритм являє собою систему для «осмислення» текстів комп'ютером, засновану на методиці глибокого навчання (Deep learning). Вона здатна відповідати на питання по незнайомому тексту, вибираючи правильний варіант з декількох запропонованих. Дослідники тренували алгоритм на декількох сотнях оповідань для дітей, об'єднаних з парами питання-відповідь для кожного тексту. Після завершення навчання програму перевіряли на незнайомому тексті.


Глибоке навчання (англ. Deep learning) - набір алгоритмів машинного навчання, які намагаються моделювати високорівневі абстракції в даних, використовуючи архітектури, що складаються з безлічі нелінійних трансформацій. Під терміном «глибина» в даному випадку розуміється глибина графа обчислень моделі - максимальна довжина між вхідним і вихідним вузлами конкретної архітектури. У випадку, наприклад, простої нейронної мережі прямого поширення глибина відповідає кількості шарів мережі.

Зокрема, при тестах на коротких фрагментах тексту першої книги про Гаррі Поттера програма безпомилково відповіла на питання «Що було секретом Дурслей?» вибравши серед варіантів «дрелі», «Поттери», «кішки вміють читати» і «їх маленький син» відповідь «Поттери». Крім того, проаналізувавши сцену відразу після розподілу Гаррі (фінальні фрази Розподільчого капелюха не увійшли у уривок) алгоритм правильно відповів на питання «В який з факультетів капелюх розподілила Гаррі??».

Автори зазначають, що ключовим у роботі алгоритму є аналіз тексту на різних масштабах - від окремих слів до словосполучень та речень. Для досягнення такого ефекту програмісти спеціальним чином налаштовували нейромережу перед навчанням. У результаті, за словами розробників, відсоток правильних відповідей виявився на 15 відсотків вищим, ніж у інших алгоритмів, заснованих на глибокому навчанні.

Система в першу чергу призначена для автоматичного аналізу технічних текстів, таких як інструкції щодо застосування і патенти. Вона може дозволити комп'ютерам самостійно аналізувати і «розуміти» тексти, відкриваючи нові шляхи для збору даних.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND