данные
Россия и футбол в британском The Guardian
Как Россия подается в публикациях ведущего медиа-ресурса Соединённого Королевства?
Финальный матч главного футбольного события четырёхлетия отгрянул, не оставив, пожалуй, никого равнодушным. Настало время подводить итоги.
Чемпионат мира по футболу сконцентрировал внимание международной общественности на России. На месяц в нашу страну приехали представители ведущих информационных ресурсов со всего мира, которые вместе с иностранными болельщиками оценивали готовность России к проведению столь масштабного мероприятия.
Примечательно, что и в российских медиа появилось множество материалов, в которых излагаются впечатления журналистов от российского быта во время Мундиаля. Дайджест зарубежных СМИ о России стал едва ли не отдельным жанром отечественной журналистики. Мы, в свою очередь, решили также использовать в своей работе подобный механизм, но в своеобразной манере. Для этого мы обратились к языку программирования R и пакету GuardianR, созданный для работы с API британского издания The Guardian. Выбор в пользу именно этого СМИ связан как с тем, что оно считается ведущим британским медиа, так и наличием технических возможностей для более комфортного и быстрого анализа контента сайта.
При отборе публикаций на этом сайте нами было принято решение ориентироваться не только на те публикации, которые появились во время Чемпионата мира, но и те, которые предшествовали ему за последний год - с 14 июня 2017 года. В этот временной отрезок отношения между Россией и Великобританией ухудшились из-за отравления Сергея Скрипаля и его дочери химическим веществом "Новичок". Британское правительство обвинило в этом российские спецслужбы. Сборная Англии от участия в главном соревновании 4-летия не отказалась, хотя официальная делегация не включила в свой состав высокопоставленных чиновников и членов королевской семьи. Тем не менее, английские болельщики, которые не побоялись приехать в России, были приятно удивлены высоким уровнем безопасности, несмотря на публикации в британских СМИ о возможных рисках столкновения с российскими футбольными ультрас. Не остались в стороне и футболисты, которые поблагодарили оргкомитет за высококлассную организацию проживания, логистики, тренировочного процесса и матчей первенства мира.
Процедура исследования предельно проста. Нами анализируются две базы статей. Первая - это те материалы, которые появились в разделе Football с 14 июня этого года до 10 июля. Во вторую базу попали статьи из раздела World. Ключевыми словами для двух массивов данных стали Russia и Kremlin соответственно.

Цель материала сводится к тому, чтобы понять, какие языковые единицы в большей степени применяли британские журналисты, когда писали о России. Для этого мы использовали не только уже известный метод построения облаков слов / словосочетаний, но и визуализацию слов, с которыми чаще всего встречаются интересующие нас выражения.

Результаты

Для начала представим результаты по так называемому "политическому" блоку статей (Иллюстрация 1). Здесь мы сравниваем два слова - Россия и Кремль. Вывод из него можно сделать лишь один - со словом "Russia" британские журналисты больше всего используют слова прямо связанные с политической позицией ("критика", "критикует", "поддерживает", "связана").

Слово "Кремль" в этом отношении обладает меньшей "субъектностью". Больше всего после него идут предлоги, модальные глаголы и артикли, которые не несут смысловой нагрузки.
Иллюстрация 1. Политическая Россия в The Guardian
Теперь обратим внимание на футбольный датасет. Здесь мы сравниваем два слова (Россия и ФИФА) в контексте анализа наиболее частотных слов после них (Иллюстрация 2). Выбор в пользу именно этой пары был обусловлен гипотезой о том, что в спортивном блоке The Guardian и Россия, и ФИФА будет характеризоваться в не самом лучшем свете из-за предыдущих скандалов (допинговая эпопея Зимней Олимпиады 2014 года в Сочи и коррупционные практики в Международной федерации футбола). Гипотеза эта не нашла подтверждения. Используемые слова часто не имеют смысловой нагрузки.
Иллюстрация 2. Россия и ФИФА в The Guardian
Теперь обратимся к гораздо более традиционным средствам визуализации - облаку словосочетаний. Снова обратим внимание на политические статьи в The Guardian. Здесь нет никаких сюрпризов. Как и предполагалось изначально, основной костяк выражений касается политической тематики - химическое оружие, Сирия, Северная Корея, крайне правые политические силы, имена политиков (Владимир Путин, Дональд Трамп, Тереза Мэй, Ким Чен Ын).
Иллюстрация 3. Облако словосочетаний по "политическому" блоку статей из The Guardian
Футбольное облако словосочетаний также показало то, что нужно. Имена футболистов и тренеров (Gareth Southgate, Harry Kane, De Bruyne, Dele Alli), названия стран (Saudi Arabia, Costa Rica), словосочетания, характеризующие игровой процесс (First Half, Semi Final, Penalty Area) идут вперемешку с упоминаниями политиков (Vladimir Putin, Donald Trump, Theresa May) и политических тем (Chemical Weapons, North Korea).
Иллюстрация 4. Облако словосочетаний по "футбольному" блоку статей из The Guardian
Подытоживая проведённое мини-исследование, отметим, что тексты, размещённые в спортивном разделе The Guardian, не исключают примешивания политической составляющей, когда речь заходит о России.

Код, использованный в рамках этой статьи, представлен здесь.
Айдар Зиннатуллин
кандидат политических наук