данные
Твиттер-миллионники
Какие города-хозяева ЧМ-2018 самые активные в Твиттере?
На период Чемпионата мира упоминания российских городов в международной прессе и социальных медиа увеличились в небывалых доселе масштабах.
Мордовия Арена (причем на кириллице) в Инстаграм-аккаунте Английской футбольной Премьер-Лиге, живописные фотографии Казани на личной странице Мануэля Нойера, купания английских футболистов верхом на надувных единорогах футболистов национальной команды Англии, - всё это и многое другое видят любители футбола во всем мире, помимо телевизионной картинки.
Редакция The Society решила исследовать, наверное, самую удобную для анализа социальную сеть Twitter, чтобы ответить на вопрос, какие города, принимающие у себя матчи Чемпионата мира, являются наиболее активными в социальных медиа. Методология подобного микроисследования предельно проста. Мы останавливаем внимание только на городах-миллионниках, за исключением Москвы и Санкт-Петербурга. Причина исключения двух последних мегаполисов заключается в том, что их численность в разы превосходит относительно ровные Казань (1 243 500), Самару (1 169 719), Нижний Новгород (1 270 241), Ростов-на-Дону (1 125 299), Екатеринбург (1 455 904), Волгоград (1 015 586). В базу изучаемых твитов попали записи с хештегами соответствующих городов на русском языке (#Казань, #Самара, #Волгоград, #НижнийНовгород, #Екатеринбург, #РостовнаДону). Для этого нами использовался пакет rtweet для языка программирования R. Фукнция search_tweets2 из этого пакета позволяет собрать твиты за последние 6-10 дней. Таким образом, в наш датасет анализируемых твитов попали записи с 16 по 26 июля. Общее количество записей - 2132.
Рисунок 1.
Лидером по количеству записей в Twitter стала Самара. Впрочем, этому есть вполне понятное объяснение. 25 июня сборная России играла матч с Уругваем в этом городе. Неудивительно, что Самаре было приковано внимание любителей футбола со всей страны, а не только из этого поволжского города.

Далее обратим внимание на то, когда больше всего публиковались записи. Ситуация представлена на рисунке 2.
Рисунок 2.
Всплески активности публикаций по всем городами пришлись на 17 и 19 июня. Матч с Египтом Россия провела в Санкт-Петербурге, который мы исключили из единиц анализа. Вероятно, такая активность (не самая высокая, справедливости ради, - всего около 15 твитов) объясняется какими-то локальными событиями в пределах исключительно одного города.
Работать с Twiiter'ом удобно ещё и потому, что к определённой части записей можно раздобыть информацию о локации пользователя. К сожалению, в нашем датасете твитов с геопозицией не так много - всего 56 на более чем 2000 записей. На рисунке 3 представлено распределение авторов в глобальном масштабе. Любопытно, что на карте отмечены такие далёкие от России страны, как Мексика, Великобритания. Это объясняется, скорее всего, включенным VPN. Всё-таки после недавней эпопеи с ограничением доступа к Telegram техническая грамотность россиян резко повысилась.
Рисунок 3.
Заключительной иллюстрацией этого материала будет график, показывающий распределение публикации записей с интересующими нас хештегами по пользователям, согласно количеству их подписчиков. Ситуация здесь также предельно простая. Больше всего записей делают обычные пользователи сервиса микроблогов, у которых фолловеров не так много (менее 200-300).
Рисунок 4.
Код, использованный для написания этой статьи, представлен здесь.
Айдар Зиннатуллин
кандидат политических наук