OUR COMPANY
О чем пишут "русские тролли", повлиявшие на американские выборы?
Краткий анализ текстов в Twitter
Тема российского вмешательства в президентские выборы в США в 2016 году не утихает спустя уже почти два года. Американские исследователи Даррен Линвиль и Патрик Уоррен собрали твиты, авторство которых принадлежит, по их мнению, "Фабрике троллей", ответственной за вмешательство в американские выборы через распространение фейковых новостей.
Издание Five Thirty Eight опубликовало на своей странице в GitHub полную базу данных, содержащую более 3 миллионов записей из Twitter. Исследователи уже провели некоторую работу с массивом данных, рассмотрев то, как ведут себя тролли, пишущие на английском языке. Ввиду того, что датасет содержит значительное количество записей на русском языке, - 624 124 твита, мы акцентируем собственное внимание именно на этой части базы данных.
Мы используем метод латентного распределения Дирихле, чтобы понять, какие части изучаемой нами базы твитов являются наиболее сходными. Это позволит нам выявить возможные общие паттерны записей троллей.