Комп'ютерну програму навчили писати реп

Колектив вчених з Фінляндії створив алгоритм DeepBeat, що пише текст для реп-композицій. Автори використовують вибірку з 10 980 реальних текстів англомовних MC, комбінуючи рядки з різних «старих» пісень для написання однієї «нової». При цьому можна задавати тематику композиції, тоді програма буде намагатися підбирати рядки відповідного змісту. Основою роботи стало використання декількох алгоритмів машинного навчання для визначення «підходящого» рядка на підставі рими і заданої тематики. Препринт роботи опубліковано на сайті.


Вибір репу як об'єкта дослідження автори пояснюють тим, що цей жанр найлегше піддається параметризації. Це пояснюється тим, що реп музика дуже сильно покладається на «ритм тексту» - правильно підібрані і розставлені рими, що створюють унікальний, «розгойдуючий» характер композиції.


Саме на рими і робили акцент вчені, коли створювали модель майбутньої програми. З рядків прибирали всі згодні, а решту послідовності гласних порівнювали між собою, щоб знайти відповідну риму.

Автори використовували кілька типів рифм, від найпростіших - «ідеальних рифм» - на кшталт «палиця-галка», до популярних у реп-музиці «ассонансних рифм», в яких є тільки збіг гласних звуків, але згодні можуть повністю відрізнятися. Крім того, асонансна рифма може «розтягуватися» на кілька слів, наприклад:

«This is a job — I get paid to [sling some raps],What you made last year was less than my [income tax]»

Для визначення ступеня збігу між різними рядками використовувалося глибоке машинне навчання і метод опорних векторів (Rank SVM). Як ознаки кожного рядка виділяли кінцеву риму, довжину рядка, елементи семантичного аналізу та ряд інших.

Одним з «побічних», але цікавих результатів роботи стало визначення ступеня «зарифмованості» тексту. Автори навіть побудували список відомих реп-виконавців, ранжований за цим показником. Перше місце в ньому зайняв Inspektah Deck з показником «щільності рифм» 1.187. Nicki Minaj, наприклад, опинилася на 31 місці, 2Pac - на 33, Eminem - на 39, Jay-Z - на 50. У роботі цей показник використовувався в якості порівняльної характеристики роботи нового алгоритму.

Основним підсумком роботи стали написані (вірніше - скомпільовані) тексти реп-композицій. Частину з них можна прочитати на сайті лабораторії. Автори обмежилися «простою» схемою рифмування aabb, але при цьому використовували асонансні рими довжиною до 8 складів, наприклад:


«But hey [maybe I’ll never win]Stressing me — [stressing me, my memories]»

У висновку роботи автори зауважують, що представлений ними алгоритм є прикладом «computational creativity» («обчислювальної творчості»). Ця область зазвичай являє собою серйозну проблему для вчених, проте використання репу в якості об'єкта дозволило дещо спростити завдання завдяки ритміці як жанрової особливості. У планах вчених стоїть ускладнення алгоритму і «написання» текстів не за рядками, а за словами.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND