Машинне навчання вирахувало торговців опіоїдами в Twitter

За допомогою машинного навчання команда дослідників з Каліфорнійського університету в Сан-Дієго вирахувала користувачів Twitter, які займаються незаконним продажем опіоїдних анальгетиків. Описовий метод стаття вийшла в журналі.


Алгоритми машинного навчання дозволяють дослідникам працювати з великим масивом даних, виявляючи часом неочевидні на перший погляд зв'язки. Дуже часто об'єктом аналізу виступають пости користувачів у соціальних мережах. Системи штучного інтелекту дозволяють не тільки виявити певні закономірності в поведінці людей в інтернеті, а й вирахувати тих, хто порушує закон або правила конкретної спільноти, наприклад Facebook.


У 2008 році, через кілька років після смерті 18-річного Райана Хейта (Ryan Haight) від передозування вікодином, конгрес США випустив акт, що забороняє поширювати в інтернеті не підлягають вільному обігу речовини. Автори нової роботи використовували машинне навчання, щоб знайти твіти з повідомленнями про онлайн-продаж опіоїдних анальгетиків. За допомогою спеціального сервісу вони протягом півроку відбирали пости в твіттері, що містять назви опіодних: «перкоцет», «фентаніл», «вікодин», «оксиконтин», «оксикодон» і «гідрокодон». До вибірки потрапило майже 620 тисяч записів.

На наступному етапі вчені використовували алгоритм BTM, що вміє визначати теми коротких текстів, щоб відібрати твіти, пов'язані з продажем ліків. Завдяки цьому число постів у вибірці скоротилося до 1778, причому 90 відсотків з них містили посилання на онлайн-магазин. Перевірка показала, що приблизно 46 відсотків посилань були робочими і дозволяли здійснити нелегальну покупку в мережі. Дослідники змогли виділити сім окремих URL-адрес, що належали кільком аптекам, які використовували блоги і соцмережі для продажу, а також рекламним сайтам. Частина магазинів перебувала в Пакистані.

Минулі дослідження Твіттера показали, що соціальна мережа може бути джерелом емоційного зараження. Крім того з'ясувалося, що кількість фоловерів у соціальних мережах безпосередньо залежить від того, до якої демографічної групи належить користувач.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND