«Підрахунки легітимізують гуманітарну науку»

В останні роки все більше дослідників, які займаються традиційними гуманітарними науками, починають дивитися на предмет своїх праць по-іншому, застосовуючи до нього методи аналізу даних. Ця порівняльна нова область називається «цифрові гуманітарні науки», або. Про те, на які питання дозволяє відповісти новий підхід до традиційних знань, а також про те, чи змінює він погляд на гуманітарні науки в цілому, ми поговорили з доцентом Школи лінгвістики і співробітником Центру цифрових гуманітарних досліджень НДУ ВШЕ Борисом Орєховим.


N + 1: Сьогодні всім більш-менш відомо, що таке комп'ютерна лінгвістика, що з'явилася ще в середині минулого століття, на зорі становлення штучного інтелекту. Ми знаємо, що її головне завдання - опис і використання природничих мов за допомогою комп'ютерних і математичних методів. Набагато менше відомо, що таке цифрові гуманітарні науки (тут і далі -). Чи пов'язані вони якось з комп'ютерною лінгвістикою?

Борис Орєхов: Якщо намагатися оцінити існуючий стан речей, то наукова складова комп'ютерної лінгвістики, про яку ви говорите, не єдина і - по факту - не головна. Головне для сучасних комп'ютерних лінгвістів - це діяльність, яку можна назвати інженерною, це створення технологій (наприклад, для автоматичного вилучення фактів або відносин з тексту), які можна було б вбудувати в комерційні продукти. Тобто власне опису мови там не так вже й багато, а наскільки взагалі технології спираються на наукові описи, це питання філософське.


Що стосується DH, то ця область набагато ширша за комп'ютерну лінгвістику. У цій сфері вчені та розробники мають справу не тільки з текстами, а й із зображеннями, 3D-моделями, реконструкціями у форматі віртуальної реальності. Комп'ютерна лінгвістика в числі інших джерел може тільки надати вченому-гуманітарію цікавий матеріал для осмислення.

Чим займаються фахівці в області DH? Які у них головні цілі і завдання?

Якщо говорити про DH взагалі, то якусь єдність в плані предмета досліджень побачити в ньому важко. DH - багато в чому так званий «зонтичний» термін: на присвячених йому конференціях зустрічаються люди, які застосовують різні методи до дуже різних речей. Об'єднуються вони, швидше, не цілями і завданнями, а матеріалом: кіно, музика, література, живопис, історичні документи, культурно значущі тексти (наприклад, праці філософів).

Іноді фахівці з DH виходять за рамки і цього кола і занурюються в питання, близькі соціологам і антропологам. Скажімо, в одній статті дослідник намагається зрозуміти, наскільки подібно критики оцінюють фільми. Це не зовсім про кіно, але і не в чистому вигляді соціологія, а комп'ютерної лінгвістики там немає зовсім. Ось такі «дивні» дослідження, як би зроблені поза форматом традиційної наукової рубрикації, і опиняються «під парасолькою» DH.

Розкажіть про методи, які найчастіше застосовуються в DH-дослідженнях крім методів обробки природної мови.

У DH найчастіше застосовують не стільки методи обробки природної мови, скільки те, що називається аналізом даних. Це широкий спектр інструментів, розроблених всередині математичної статистики для пошуку закономірностей всередині великих масивів формалізованої інформації. Це те, що допомагає побачити тенденцію, або «тренд». Це різного роду регресії, розрахунок кореляцій, кластерний, коваріаційний аналіз. Але це і візуалізація даних, графіки, які роблять статті і доповіді про DH - крім власне змістовної складової - привабливими візуально:

COM_SPPAGEBUILDER_NO_ITEMS_FOUND