Алгоритм розпізнав самотніх літніх людей за мовою

Американські дослідники навчилися передбачати самотність людини за автоматичним аналізом її мови. Для цього вони зібрали інтерв'ю 80 літніх добровольців і побудували модель, яка співвідносить різні параметри сказаного (довжину тексту і, наприклад, емоційну наповненість) з кількісними і якісними ознаками самотності: тим, як людина сама відповідає на питання про своє відчуття, і тим, які відповіді вона дає у відповідних опитувальниках. Алгоритм навчився передбачати самотніх з точністю до 94 відсотків, а за допомогою аналізу інтерв'ю вчені також виділили відмінності в тому, як висловлюють свої відчуття чоловіки і жінки. Стаття опублікована в.


Основним методом діагностики психічних розладів і симптомів досі залишається бесіда з психіатром або терапевтом: за скаргами пацієнта на його стан, нав'язливі думки та інші ознаки лікар виносить відповідний діагноз. Поки інші методи діагностики (наприклад, за допомогою нейровізуалізації) знаходяться на стадії досліджень, вчені намагаються поліпшити і класичну діалектну діагностику.


Один із способів такого поліпшення - автоматизація. Пацієнт з тих чи інших причин (скажімо, через страх стигматизції) може не повідомляти психіатру про якісь симптоми. У такому випадку автоматична діагностика за мовленням насправді може бути корисною: за допомогою методів обробки природної мови дослідники можуть визначити найбільш вірогідний діагноз за мовленням пацієнта і поза бесідою з психіатром - за словами, які він вживає, емоційним забарвленням та іншими ознаками.

Так, автоматично по промові вже навчилися діагностувати депресію, передбачати психоз, а також визначати шизофренію на початкових стадіях розвитку. Варша Бадал (Varsha Badal) з Каліфорнійського університету в Сан-Дієго та її колеги запропонували діагностувати по промові ще один стан - самотність.

Вчені зосередилися на літніх людях - найбільш вразливій перед самотністю групі населення: всього в дослідженні взяли участь 80 англомовних людей у віці від 66 до 94 років. Кожен з них заповнив стандартизований опитувальник на визначення самотності, а також взяв участь в інтерв'ю тривалістю до 90 хвилин. У ньому експериментатори спершу запитували в учасників, чи відчувають вони себе самотніми, а потім або просили розповісти, в чому для них проявляється це почуття, або (при негативній відповіді) - поміркувати про те, чому самотніми себе можуть почувати інші люди.

Отримані інтерв'ю потім транскрибували вручну (всього вийшло 80 транскриптів загальною довжиною понад 1,2 мільйона слів) і досліджували за допомогою доступних алгоритмів обробки природної мови. Зокрема, особливу увагу дослідники звернули на довжину відповідей учасників, ступінь їх злагоди та емоційну наповненість. Останні два параметри виділяються на основі слів, які використовує учасник: скажімо, велика кількість конструкцій з запереченням буде вказувати на те, що він не згоден з темою розмови, а семантика використовуваних слів - на відчутні з приводу теми емоції (всього використовувалося п'ять стандартних: смуток, радість, страх, огида і злість).

Дані потім розділили в пропорції 4:1 на навчальну та тестову вибірку. За допомогою першої дослідники навчили алгоритм, який пророкує самотність учасника за згодою та емоційною наповненістю в його промові: спочатку для цього учасників розділили на самотніх і неодиноких залежно від їхньої відповіді на запитання «Чи відчуваєте ви себе самотніми?». Подробиці роботи алгоритму вчені не розкривають, але для нього використовувалися стандартні методи кластеризації та класифікації (серед них - метод k-найближчих сусідів і random forest).

Первинний аналіз інтерв'ю показав, що самотні учасники говорили більше (p < 0,01), причому довжина інтерв'ю корелювала як з якісною оцінкою (відповіддю на питання про самотність), так і з кількісною (результатом опитувальника). Жінки виявилися більш самотніми за якісними оцінками, а чоловіки - за кількісними. Для самотньої мови був характерний смуток, і його, в основному, висловлювали жінки; чоловіки ж частіше використовували семантично радісні і боязкі конструкції - мабуть, це і стало причиною того, що за кількісними оцінками їх самотність визначалася краще.


При цьому алгоритм машинного навчання, який передбачав самотність з інтерв'ю, із завданням впорався успішно: якісні ознаки самотності він розпізнавав з точністю до 94 відсотків, а кількісні - з точністю до 76 відсотків.

Як показують дослідження, самотність пов'язана з підвищеним ризиком розвитку різних захворювань, включаючи діабет і деменцію. Оскільки ризик цих захворювань також зростає з віком, своєчасна профілактика може сильно допомогти - і в цьому сенсі нові, автоматизовані способи діагностики дуже корисні. Поки подібні алгоритми не застосовують у психіатричній практиці, вони все одно можуть допомогти: наприклад, показати фахівцям, як саме люди висловлюють свою самотність залежно від статі, і поліпшити тим самим діагностику по бесіді.

Взагалі, самотність і вік досить сильно пов'язані: наприклад, коли людина ще молода, з тим, чи відчуває вона себе самотньою, пов'язана її етнічна приналежність, а ось у літньому віці - стан здоров'я.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND