Ускладнення мемів з роками довели математично

Італійські математики досліджували більше двох мільйонів мемів з Reddit, щоб охарактеризувати їх еволюційну динаміку. Застосувавши методи машинного навчання, вони кластеризували всі меми навколо шаблонів, на основі яких вони створювалися, і з'ясували, як з популярністю шаблону пов'язані час його життя і частота створення нових мемів. Вчені також визначили, що складність мемів з часом тільки зростає, що може свідчити про перетворення інтернет-мемів на метаязик. Дослідження опубліковано в.


Зі збільшенням часу, який люди проводять в інтернеті, роль інтернет-культури незмінно зростає. Одним з відмінних її елементів стали інтернет-меми. Незважаючи на їхню розважальну природу, меми як динамічні системи, що бурхливо розвиваються, становлять великий інтерес для цілого ряду наук, починаючи від фізики складних систем і закінчуючи культурологією.


Наукова спільнота на сьогодні накопичила досить великий пласт досліджень мемів, як у контексті їх різної форми (тексти, зображення, відео), так і в контексті їх ранжування та поширення. Все це сприяло накопиченню великого інструментарію для вивчення мемів, проте фундаментальним аспектам їх еволюції поки приділено мало уваги. Таке дослідження, зокрема, могло б підтвердити або спростувати гіпотезу про те, що інтернет-меми складають метаязик Інтернету.

Група італійських математиків під керівництвом Карло Валенсіза (Carlo Valensise) застосувала методи машинного навчання та кластерного аналізу для характеризації великої кількості мемів у контексті еволюційної моделі їх динаміки. В якості об'єкта дослідження вчені вибрали більше двох мільйонів візуальних мемів, опублікованих на Reddit c 2011 по 2020 рік. Крім суто динамічних характеристик вони оцінили також їх ентропію і складність.

Еволюційний підхід спирається на концепцію, розвинену Докінзом, який називав мемом одиницю культурної інформації. І хоча докінзівська модель культурної еволюції в цілому не визнана науковою спільнотою задовільною, окремі її елементи досі залишаються надійною основою для опису поширення мемів. Зокрема, математики звернулися до трьох основних елементів еволюційної теорії: реплікації, варіації та відбору.

Для візуальних інтернет-мемів всі три елементи досить очевидні. У них, як правило, є загальний шаблон, який користувачі регулярно використовують як засіб виразу. Ці шаблони регулярно модифікуються за допомогою тексту, колажу або інших візуальних змін згідно контексту комунікації. Нарешті, меми конкурують один з одним за увагу користувачів, що призводить до того, що одні меми швидко забуваються, в той час як інші використовуються дуже довго.

Щоб дослідити ці механізми кількісно, математики застосували до двомільйонного датасету з візуальними мемами алгоритм неконтрольованої кластеризації, розділений на два етапи. На першому етапі зображення ділилися на чотири великі групи (два набори з тваринами, один з людьми і все інше) за допомогою алгоритму SCAN (Semantic Clustering by Adopting Nearest neighbors), заснованого на глибокому навчанні. У його межах кожне зображення налаштувалося вектором, чия довжина визначається тим, скільки семантично осмисленої інформації векторний простір може вмістити. Нейронна мережа навчалася за допомогою мінімізації функції втрат між вектором вихідного і вектором спотвореного (повернутого, скошеного і так далі) зображень, після чого проводилася груба кластеризація з розмірністю вектора, рівною 2048.

На другому етапі автори використовували алгоритм HDBSCAN (Hierarchical Density-Based Spatial Clustering of Applications with Noise), який працював з меншою розмірністю вектора (20 проти 2048), але продукував більшу кількість кластерів. Сама кластеризація проводилася шляхом порівняння вектора від зображення з векторами його найближчих сусідів.


У результаті математики згрупували меми в кластери згідно з шаблонами, на основі яких користувачі робили їхні варіації. Іншими словами, всі зображення в межах одного кластера були схожі на вихідний шаблон. Таким чином, вчені змогли стежити за тим, як народжуються нові шаблони, і як народжуються нові меми в межах кожного кластера. Так, вони побачили, що кількість нових шаблонів зростає з часом за експоненційним законом. Апроксимація показала, що воно подвоюється кожні шість місяців.

Математики також проаналізували швидкість мутації мемів, виражену через те, як часто і як довго користувачі продовжують створювати нові меми на основі того чи іншого шаблону. Виявилося, що динаміка варіативності істотно корелює з розміром кластера (популярністю шаблону). Так, час життя того чи іншого шаблону загалом корелює з його популярністю. З нею ж пов'язана швидкість придумування нових мемів: в дуже малих кластерах різниця між вигадуванням нових мемів може досягати сотні місяців, в той час як в дуже великих воно рідко перевищує три-чотири місяці.

Нарешті, слідуючи методології своїх колег, які вивчали живопис, автори зіставляли кожному мому перестановочну ентропію і статистичну складність. Перестановочна ентропія вимірює ступінь безладу в розташуванні пікселів. Високі значення вказують на високу випадковість пікселів, а низькі значення відповідають більш регулярним шаблонам. Статистична складність же оцінюється виходячи зі структурної навантаженості зображення. Нетривіальні просторові патерни дають у неї великий внесок, тоді як сильно впорядковані або хаотичні патерни відповідають низьким вкладам.

В результаті математики з'ясували, що для всіх розглянутих спільнот на Reddit, в яких користувачі продовжують публікувати меми, їх середньорічна складність незмінно зростає. Автори вважають, що цей процес відображає формування інтернет-мемів як метаязика. Примітно, що такі ж тенденції були виявлені і в живописі. Разом з тим, ускладнення неминуче пов'язане з формуванням діалектів цієї мови, зрозумілих тільки всередині окремих спільнот. Іншими словами, мем, створений всередині якоїсь специфічної групи людей, наприклад, геймерів, буде незрозумілим у всьому іншому інтернеті.

Будучи одним з найбільших сайтів в інтернеті, Reddit регулярно стає джерел даних для вчених. Ми вже розповідали, як вчені з його допомогою визначили найбільш впливові джерела поширення мемів, досліджували мотиви інтернет-тролінгу і навіть спробували навчити штучний інтелект розуміти людську мову.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND