Діалоги вигаданих особистостей допоможуть чат-ботам підтримати розмову про себе

Дослідники з Facebook представили Persona-Chat - базу даних, що складається з більш ніж 160 тисяч уривків діалогів реальних людей, які розмовляли від імені вигаданих персон. Розробники також навчили на прикладі цих даних комп'ютерну модель: в майбутньому, як повідомляється в препринті, опублікованому на arXiv, вона може допомогти персоніфікувати чат-ботів і голосових помічників.

Незважаючи на те, що голосові помічники і чат-боти з кожним роком стають все досконалішими, підтримати бесіду вони все ще можуть насилу. Причиною тому - обмеження навчальної вибірки: комп'ютер можна навчити розмовляти і навіть відповідати на питання, але для підтримки цільної бесіди даних може бути недостатньо. Чат-бот, наприклад, не володіє сформованою особистістю та інтересами - і тому не може відповісти на складні відкриті питання на кшталт «що ти любиш робити в дощовий день?». Зрозуміло, є варіант, в якому чат-бот або голосовий помічник відповідає на невідоме йому питання абстрактною фразою на кшталт «я не знаю» або пошуковим запитом - але розмовою вважати це не можна. Крім того, при спілкуванні такий співрозмовник утримує в пам'яті тільки невеликий уривок діалогу і не може повернутися до інформації, наданої йому кілька кроків назад.


Розробники з Facebook AI Research під керівництвом Джейсона Вестона (Jason Weston) зібрали базу даних з більш ніж тисячі «персон»: невеликих (п'ять речень не більше 15 слів у кожному) описів абстрактних особистостей, придуманих реальними людьми. Наприклад, опис такої «персони» може виглядати так:

«I am a vegetarian. I like swimming. My father used to work for Ford. My favorite band is Maroon5. I got a new job last month, which is about advertising design.»

"Я вегетаріанець. Я люблю плавати. Мій батько працював у Ford. Моя улюблена група - Maroon5. Місяць тому я почав працювати дизайнером в рекламному агентстві "

Всього в базі даних 1155 таких «персон». Крім того, дослідники попросили іншу групу людей оцінити отриманих «персон» і переписати їх на основі схожих, пов'язаних характеристик: наприклад, любов до Maroon5 могла бути замінена в «персоні» на любов до пісні «She Will Be Loved», а твердження про те, що батько «персони» працював на Ford, могло перетворитися на твердження про те, що близький родич працював в автомобільній компанії. Це необхідно для того, щоб розширити відомі про «персону» факти для складання можливого діалогу.

Після цього двох людей, які надали «персони», просили трохи поговорити: кожному з них була призначена випадкова «персона». У результаті в базі цих діалогів виявилося 164356 висловлювань, і на основі цієї бази дослідники навчили кілька комп'ютерних моделей (генеративну Seq2Seq і ранжуючу Memory Networks). Отримані моделі чат-ботів потім оцінили, попросивши поговорити з ними реальних людей: діалог міг будуватися або навколо «персони» комп'ютера, або навколо «персони» людини, або навколо обох учасників діалогу. Розроблені моделі обійшли алгоритм, навчений діалогам на цитатах з фільмів, з втікачів, залученості в діалог і повноті бесіди.

Приклад діалогу людини (PERSON 1) і чат-бота, навченого на зібраній базі даних

[PERSON 1:] I just got done playing soccer. What have you been up to?


[PERSON 2:] I do not have pets. I spend my free time writing. what about you?

[PERSON 1:] Just graduated from college. Looking for work.

[PERSON 2:] yes I graduated, in writing and poetry.

[PERSON 1:] Have you had anything published?

[PERSON 2:] I mainly write fiction novels.

[PERSON 1:] Do you like to watch sports?

[PERSON 2:] do you like kings of leon my favorite by them is use somebody


[PERSON 1:] Are you married? I will be married soon.

[PERSON 2:] haha, no time. I have got a novel to finish.

[PERSON 1:] What is your novel about?

[PERSON 2:] it is a love story. I really enjoy writing. do you write or read?

[PERSON 1:] Like to read. Spend most time watching football.


[PERSON 2:] yes I do I am and author for a living

[PERSON 1:] Я щойно закінчив грати у футбол. А ти що робив?

[PERSON 2:] У мене немає домашніх тварин. У вільний час я пишу. А ти?

[PERSON 1:] Щойно закінчив вчитися. Шукаю роботу.

[PERSON 2:Так, я закінчив вчитися, я вивчав поезію і прозу


[PERSON 1:] У тебе щось вже опубліковано?

[PERSON 2:] Я в основному пишу фантастику

[PERSON 1:] Тобі подобається дивитися спорт?

[PERSON 2:Тобі подобаються Kings of Leon? Моя улюблена їхня пісня - «Use Somebody»

[PERSON 1:] Ти одружений? У мене скоро весілля


[PERSON 2:] Хаха, ні, у мене немає на це часу. Треба книгу дописати

[PERSON 1:] Про що твоя книга?

[PERSON 2:] Про любов. Я дуже люблю писати. А тобі більше подобається писати або читати?

[PERSON 1:] Я люблю читати, але взагалі - частіше футбол дивлюся

[PERSON 2:] Так, я заробляю на життя тим, що пишу

Розробники зазначають, що зібрана база даних може бути корисною для створення нових та удосконалення старих моделей чат-ботів і голосових помічників. Базу даних також викладено у відкритий доступ.

Підтримка бесіди на абстрактні теми - це швидше доповнення для голосових помічників і чат-ботів. А їх основною функцією крім управління чим-небудь і розпізнавання голосових команд може бути навіть надання психологічної підтримки: як Woebot, який при спілкуванні з користувачами використовує методи когнітивно-поведінкової психотерапії.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND