Ученые выяснили, что мемы с годами становятся сложнее
Математики из Италии исследовали более 2 млн мемов и выяснили, что они становятся все сложнее.
Исследование опубликовано в Scientific Reports, кратко о нем пишет N+1.
Математики под руководством Карло Валенсизе при помощи методов машинного обучения и кластерного анализа изучили и охарактеризовали мемы, которые были опубликованы на Reddit с 2011 по 2020 год, в контексте эволюционной модели их динамики. Также были оценены их энтропия и сложность.
Математики опирались на эволюционную теорию Ричарда Докинза и исследовали мемы по трем элементам: репликации (использование общего шаблона), вариации (регулярное изменение шаблонов) и отбору (конкуренция за внимание пользователей).
На первом этапе исследования все изображения поделили на четыре группы: две группы мемов с животными, одна группа с людьми и последняя, куда вошло все остальное. Распределение на группы проводили при помощи алгоритма SCAN (Semantic Clustering by Adopting Nearest neighbors), основанного на глубоком обучении. Суть его работы заключается в том, что каждое изображение параметризировалось вектором. Длина вектора определялась тем, сколько семантически осмысленной информации может вместить векторное пространство.
На втором этапе использовался алгоритм HDBSCAN (Hierarchical Density-Based Spatial Clustering of Applications with Noise). Он работал с меньшей размерностью вектора (20, у SCAN — 2048), но продуцировал большее количество кластеров. Он проводил кластеризацию, сравнивая вектор от изображения с векторами его ближайших соседей.
Так математики получили кластеры мемов по шаблонам. То есть в пределах одного кластера все изображения были похожи на исходный шаблон. Это помогло отследить, как рождаются новые мемы и как это происходит внутри кластеров. Оказалось, что число новых мемов растет со временем по экспоненциальному закону. Каждые шесть месяцев число мемов удваивается.
Также ученые выяснили, что время жизни одного шаблона для мема коррелирует с его популярностью, с ней оказалась связана и скорость придумывания новых мемов. Например, в маленьких кластерах скорость появления новых мемов может составлять сотни месяцев, а в крупных — не больше трех-четырех месяцев.
Помимо этого, ученые пришли к выводу, что во всех сообществах на Reddit, которые изучались, среднегодовая сложность мемов растет. Исследователи считают, что это отражает формирование мемов как метаязыка. Усложнение этого метаязыка связано с формированием диалектов, которые будут понятны только внутри отдельных групп и непонятны для остальных пользователей интернета.