КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-71-10094

НазваниеМониторинг и противодействие вредоносному влиянию в информационном пространстве социальных сетей

РуководительЧечулин Андрей Алексеевич, Кандидат технических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки "Санкт-Петербургский Федеральный исследовательский центр Российской академии наук", г Санкт-Петербург

Период выполнения при поддержке РНФ 07.2021 - 06.2023 

Конкурс Конкурс на продление сроков выполнения проектов, поддержанных грантами Российского научного фонда по мероприятию «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными (30).

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-211 - Математическое моделирование социальных и экономических процессов

Ключевые словасоциальная сеть, распределенные системы, большие данные, информационно-психологическое поле, противодействие экстремизму и терроризму, средства массовых коммуникаций, массовые коммуникации, модель нарушителя, модель угроз, идеологический экстремизм, информационный конфликт, информационное противоборство

Код ГРНТИ81.93.29


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Глубина проникновения социальных сетей в повседневную жизнь человека возрастает с каждым днем. Преимущество социальных сетей состоит в возможности участников коммуникации оперативно транслировать информацию на большую аудиторию, публиковать медиа информацию, вовлекать новых участников в различные мероприятия или сообщества. Только за последние пять лет частью повседневной жизни современного общества стали более десяти различных платформ социальных сетей и уже очевидной проблемой информационной безопасности современного общества стала вредоносная информация. Кроме того, отдельные функции социальных сетей, такие как добавление в друзья, возможность комментирования и т.д., массового внедряются в различные сервисы: новостные сайты, банки, онлайн магазины и прочее. Одним из популярных способов распространения вредоносной информации и привлечение к ней внимания аудитории в социальных сетях является использование профилей несуществующих людей – ботов. На искусственно-созданных страницах ботов и на других страницах от имени этих ботов публикуются сообщения, фейковые новости, противоправная информация и ими же пишутся комментарии, добавляются отметки к другим информационным объектам. Такой подход позволяет не только свободно распространять вредоносную информацию, но и манипулировать общественным сознанием, искусственно повышать спрос или репутацию, создавать искусственную индуцированную активность, тем самым вовлекая все большее количество реальных людей в проводимую информационную атаку. Период пандемии показал то, насколько эта проблема критична. Волны паники и страхов, порождаемые информационными атаками, распространяют недостоверную информацию в социальных сетях: недостоверная информация о распространении вируса, компании антивакцинации, теории заговора связанные с 5G и искусственностью вируса. Все это может приводить не только к ухудшению психического состояния общества, но и агрессивным действиям, связанным с порчей имущества, а также действиям влияющих на физическую безопасность и состояние здоровья граждан. Этим обуславливается высокая актуальность выбранной в данном проекте темы. Качество маскировки и скорость появления новых ботов приводит к тому, что часто бывает трудно отличить реальных людей от ботов. Это позволяет проводить достаточно эффективные информационные атаки в которых на ранних стадиях участвуют только боты. В этой связи для множества стран становится актуальным вопрос о выявлении и определении характеристик ботов и информационных атак, в которых они участвуют. Эта задача не является тривиальной по многим причинам. Во-первых, количество аккаунтов в социальных сетях и количество информации, которую они создают уже достаточно большие, и они имеют тенденцию к своему дальнейшему увеличению. Во-вторых, несмотря на то, что системы обнаружения могут обнаруживать некоторые типы ботов и атак, им требуются дополнительные источники данных для повышения эффективности обнаружения. В-третьих, система должна уметь анализировать информацию в режиме, близком к реальному времени, что может быть затруднено лимитами на доступ к социальным сетям. Продление проекта направлено на решение фундаментальной научной проблемы – повышение эффективности обнаружения и получения характеристик ботов и информационных атак, в которых они участвуют. И в настоящее время эта проблема имеет недостаточное количество научно-технических решений. При этом известные средства и системы обнаружения ботов и реализуемых ими информационных атак не отвечают предъявляемым требованиям по функциональности, а следовательно и адекватности принимаемых решений, особенно в условиях постоянного роста качества маскировки ботов, стратегий проведения информационных атак и ограничениях на доступ к данным социальных сетях. Основная сложность обнаружения ботов и их вредоносного влияния в социальных сетях напрямую следует из современных тенденций развития информационной сферы, а именно, увеличения: (1) количества участников коммуникаций и объемов создаваемых ими сообщений; (2) скорости появления новых страниц в социальных сетях; (3) вариантов информационных атак; (4) количества способов привлечения внимания аудитории; (5) количества новых способов анонимизации личности, используемых в процессе коммуникации; (6) уровня гетерогенности данных; (7) многократно возросшей сложности взаимодействия и функциональности интернет сервисов. Этим обуславливается высокая актуальность тематики и результатов проекта.Анализ мировой научной литературы показывает, что в такой постановке данная задача ставится впервые, чем определяется ее высокая научная значимость и новизна. Таким образом, данный проект направлен на решение задачи, заключающейся в разработке научно-методического обеспечения, включающего совокупность взаимосвязанных моделей, методик и алгоритмов, а также реализующих их программных приложений, предназначенных для построения и функционирования систем обнаружения ботов, их характеристик, а также реализуемых ботами информационных атак и их характеристик. Предполагается, что система, основанная на результатах проекта, сможет обеспечить оперативную обработку большого массива гетерогенных данных, их точный анализ для обнаружения ботов и их информационных атак в социальных сетях, а также высокую полноту и достоверность оценки искусственности страницы и действий от ее имени, используя при этом современные методы искусственного интеллекта, в том числе машинного обучения, статистические методы, методы анализа графов, а также методы оперативной визуализации и т.д. Кроме того, данный проект будет опираться на предыдущие исследования и результаты, ранее полученные в Проекте 2018.

Ожидаемые результаты
В ходе выполнения проекта ожидается получение следующих результатов: 1. Алгоритмы извлечения признаков для обнаружения ботов на основе статистических и темпоральных данных. 2. Алгоритмы извлечения признаков для обнаружения ботов на основе графов связей. 3. Алгоритмы извлечения признаков для обнаружения ботов на основе контента. 4. Интегральная методика обнаружения и определения характеристик ботов, на основе предложенных алгоритмов 5. Классификация видов и характеристик информационных атак с применением ботов. 6. Комплекс моделей информационных атак в социальных сетях. 7. Алгоритмы оптимизации сбора исходных данных для определения характеристик информационной атаки. 8. Алгоритмы определения характеристик информационной атаки. 9. Интегральная методика обнаружения и определения характеристик информационной атаки, приводящейся с помощью ботов. 10. Научно-технические предложения по применению разработанных моделей, методик и алгоритмов обнаружения ботов и реализуемых ими информационных атак. Отмеченные результаты будут оригинальными; они будут основываться на разработках исполнителей проекта, выполненных ранее и выполняемых в настоящее время, а также базироваться на современных достижениях в области средств и методов интеллектуального анализа данных, теории графов, теории статистики, защиты информации, моделирования и др. Оригинальность планируемых результатов подтверждается тем фактом, что до настоящего времени научная задача разработки научно-методического обеспечения, включающего совокупность взаимосвязанных моделей, методик и алгоритмов, а также реализующих их программных приложений, предназначенных для построения и функционирования систем обнаружения ботов и реализуемых ими информационных атак, в указанной в проекте постановке в России не ставилась, а за рубежом проблема вынесена на обсуждение лишь в середине 2015-х годов. Известные отечественные и зарубежные публикации по этой тематике позволяют говорить только об отдельных задачах в области обнаружения ботов и реализуемых ими операций (в рамках предвыборных компаний, в рамках искусственной мобилизации претесной активности, в рамках манипуляций на финансовых рынках). На данный момент не существует системного подхода, метода, позволяющего решать поставленную в проекте научно-техническую задачу. Основные результаты работы носят фундаментальный и исследовательский характер. Они имеют большое общегосударственное и национальное значение в силу возможности своего применения в автоматизированных системах противодействия вредоносному влиянию в социальных сетях, а также в силовых министерствах и ведомствах, в административно-государственных структурах, в которых широко используются системы мониторинга и противодействия. Кроме того, потребителями могут быть российские и иностранные коммерческие организации, занимающиеся разработкой и внедрением перспективных средств мониторинга социальных сетей. Основные результаты проекта планируется опубликовать в 5 статьях в изданиях, индексируемых в базах данных «Сеть науки» (Web of Science) или «Скопус» (Scopus), в том числе в Journal of Computational Science (Q1), Sensors (Q1), Information (Q3), «Труды СПИИРАН» (Q2), а также в 10 статьях в русскоязычных изданиях, учитываемых в РИНЦ, в том числе «Проблемы информационной безопасности. Компьютерные системы», «Защита информации. Инсайд», «Вестник Санкт-Петербургского государственного университета технологии и дизайна. Серия 1: Естественные и технические науки», и др. Кроме того, планируется публикация 5 статей в трудах ведущих международных конференций, индексируемых в базах данных «Сеть науки» (Web of Science) или «Скопус» (Scopus).


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
Данное исследование направлено на изучение видов ботов социальных сетей а также способов их детектирования и характеризации. Для этого была разработана таксономия ботов и их характеристик в социальных сетях. Была приведена типизация на основе исследования рынка ботов и предложена систематизация рисков. Сформирован рейтинг угроз на основе оценок экспертов из рекламных агентств, специалистов кафедры PR факультета журналистики университета СПбГУ, специалистов-экспертов международного центра цифровой криминалистики при СПб ФИЦ РАН. Была разработана методика закупки ботов, которая позволяет получить ground-truth лейблы и извлечь некоторые характеристики ботов. Разработанная методика основана на создании фейкового сообщества, в которое в контролируемым исследователем условиях закупаются боты и исключаются реальные пользователи. С использование данной методики были собраны 70 размеченных наборов ботов. Была оценена способность человека распознать бота. Для этого была создана методика экспериментальной разметки качества ботов. Был реализован бот в Телеграме, где аннотаторы могли в удобной форме размечать аккаунты. Эксперименты показали, что для различных наборов ботов люди обладают различной способностью из распознавания, что можно выразить в виде качества ботов. Для того, чтобы иметь возможность характеризовать атаки в социальных сетях был разработан ряд характеристик ботов которые можно использовать как метрики атаки: -- experimental_quality – экспериментальное качество (включает в себя 6 различных метрик). Выражает способность человека распознать бота и рассчитывается на основе эксперимента. -- NZ – (non zero) доля не пустых / закрытых (закрытые, включает заблокированные социальной сетью) аккаунтов среди ботов. -- price – цена за бота в рублях. -- seller_type – тип продавца. Выражает стратегию управления ботов и включает 2 стратегии: магазин и биржа. -- speed – скорость бота. Выражает скорость атаки (в течении минуты, часа или суток). -- expert_quality – экспертное качество (LOW, MED, HIGH). Данные метрики легли в основу создания методов характеризации ботов, и в последующем этапе проекта лягут в основу идентификации характеристик атак. Были разработаны алгоритмы извлечения признаков ботов, которые включают в себя: -- Алгоритмы извлечения признаков для 2ух типов распределений: (1) численные; (2) временные. -- Алгоритмы извлечения признаков ботов из графовых структур, которые образуют аккаунты социальной сети. -- Алгоритмы извлечения признаков ботов из текстовых данных и изображений. В результате был сформирован список признаков, который будет использоваться для обнаружения ботов. Анализ информативности признаков показал, что наиболее полезными в задаче обнаружения ботов оказались признаки на основе графов и расширенных графов. Наименее информативными оказались признаки на основе профиля и распределений, что в целом сходится с эмпирическими наблюдениями, так как именно профиль и распределения боты чаще всего имитируют для обмана пользователей. Были предложены несколько подходов по обнаружению и характеризации ботов: -- Для задачи анализа отдельных аккаунтов разработаны методики: (1) обнаружения отдельных ботов с учителем и разметкой наборов и (2) без разметки. -- Для задачи обнаружения атак была разработана методика обнаружения группы ботов. -- Для задачи характеризации атаки (например, определения сложности атаки, уровня умений злоумышленника и т.д.) были разработаны методики определения цены, экспертного качества, экспериментального качества бота, скорости бота и типа магазина. Данные методики объединяются, интегральной методикой, которая позволяет (1) обнаружить ботов, (2) произвести валидацию того, что была совершена атака ботов, (3) определить характеристики ботов. Был разработан программный прототип обнаружения ботов, который включает в себя сбор данных, формирование общей структуры, маппинг, извлечение признаков и обучение. Для проведения экспериментов были собраны следующие наборы данных: -- Социальная сеть. Всего на основе 70 наборов ботов были собраны 22325 аккаунтов ботов, из которых 18444 аккаунтов являются уникальными. В том числе были собраны 100.000 случайных аккаунтов. Данный набор использовался для проведения экспериментов. -- Сайт СМИ. Были собраны данные по 6259 пользователям, которые оставляли комментарии с 1 января 2022 года по 1 мая 2022 года. Данный набор планируется расширить и использовать для проведения экспериментов на следующем этапе проекта. -- Мессенджер. Были собраны данные по 1277 белорусским чатам, информация о которых предоставлена проектом DzeChat. Всего данные чаты охватывают 420954 пользователя (8484432 сообщений) во временном периоде начиная с июня 2020 года. Данный набор не планируется расширять. Он будет использоваться для проведения экспериментов на следующем этапе проекта. На основе разработанного прототипа были проведены эксперименты по оценке эффективности предложенных решений. - Эксперимент индивидуального обнаружения с учителем показал, что методика индивидуального обнаружения имеет крайне высокие показатели эффективности. Влияние на детектирование ботов сильнее всего оказывает экспериментальное качество (корреляция ≈0.4), что говорит о том, что в целом, чем сложнее человеку распознать бота, тем сложнее и разработанному прототипу распознать бота. - Эксперимент индивидуального обнаружения без разметки показал, что методика индивидуального обнаружения на основе аномалий имеет крайне низкие показатели эффективности. - Эксперимент группового обнаружения показал, что что методика обнаружения группы ботов имеет крайне высокие показатели эффективности при использовании стандартной модели. При этом, использование модели на основе аномалий имеет крайне низкие показатели эффективности. - Эксперимент устойчивости к мутации показал, что предлагаемые решения достаточно устойчивы к мутации ботов. Это значит что собранные наборы данных достаточно репрезентативны чтобы обнаруживать ботов с качественно другими характеристиками, при условии что данные характеристики будут меняться со временем постепенно. - Эксперимент определения характеристик ботов показал, что разработанное средство может достаточно эффективно извлекать характеристики ботов. Были разработаны сценарии возможного применения, которые включают в себя сценарии: -- повышения информационной безопасности государства, общества и личности -- анализ и оценка рекламных кампаний в социальных сетях -- использование в госкорпорациях, коммерческих организациях и гражданским обществом для защиты репутации и целостности сетевых сообществ. -- совершенствование других продуктов защиты информации. -- использование в гуманитарных исследованиях посвященных социальным сетям. Разработанный прототип удалось протестировать на практике. В период введения QR кодов в связи с эпидемией COVID-19, в Международный Центр Цифровой Криминалистики обратилась коммерческая ритейловая компания с просьбой о расследовании волны негативных отзывов, связанных с политикой компании касательно противоэпидемических ограничений. В расследовании были выделены основные комментаторы, которые оставляли негативные отзывы. Необходимо было установить, являются ли данные аккаунты ботами или реальными пользователями. Результаты данного расследования помогли компании скорректировать свою политику и разработать более эффективную стратегию применения контрмер по сохранению репутации своего бренда. Были опубликованы 6 работ и получены 3 сертификата о государственной регистрации программ. В процессе исследования, участники проекта также принимали участие в популяризации его результатов. Так, о результатах проекта выпустили публикации более 20 СМИ, включая такие издания как “ТАСС-Наука”, “Интерфакс”, “Хабр”, “Канал Санкт-Петербург”, “Бумага” и др. Было принято участие в научно-просветительском фестивале Кампус - “Бумага” с лекцией об эволюции ботов в социальных сетях (видеозапись лекции доступна на странице проекта - https://vk.com/campus1703).

 

Публикации

1. Виткова Л.А., Котенко И.В., Чечулин А.А. An Approach to Ranking the Sources of Information Dissemination in Social Networks Information, Vol. 12, Iss. 10, No. 416, P.1-15 (год публикации - 2021) https://doi.org/10.3390/info12100416

2. Гавра Д.П., Намятова К.А., Виткова Л.А. Detection of Induced Activity in Social Networks: Model and Methodology Future Internet, Vol. 13, Iss. 11, No. 297, P.1-13 (год публикации - 2021) https://doi.org/10.3390/fi13110297

3. Коломеец М.В., Виткова Л.А., Тушканова О.Н, Чечулин А.А. Experimental evaluation: can humans recognize social media bots? Networks in the Global World 2022, - (год публикации - 2022)

4. Левшун Д.С., Тушканова О.Н., Чечулин А.А. Active learning approach for inappropriate information classification in social networks Proceedings of the 30th Euromicro International Conference on Parallel, Distributed and Network-based Processing (PDP), pp. 283-289 (год публикации - 2022) https://doi.org/10.1109/PDP55904.2022.00050

5. Намятова К.А., Виткова Л.А., Чечулин А.А. An approach to automated assessment of the image of a territorial entity in the media discourse of a foreign states The 14th International Symposium on Intelligent Distributed Computing. Studies in Computational Intelligence., Vol 1026. Springer, Cham. (год публикации - 2022) https://doi.org/10.1007/978-3-030-96627-0_20

6. Коломеец М.В. Исследование рынка ботов социальных сетей Информационная безопасность регионов России (ИБРР-2021), с. 85 (год публикации - 2021)

7. Коломеец М.В. Анализ информативности признаков вредоносных ботов в социальных сетях Актуальные проблемы инфотелекоммуникаций в науке и образовании (АПИНО 2022), - (год публикации - 2022)

8. Зеличенок И.Ю., Виткова Л.А. Компонент анализа текстов для мониторинга вредоносной активности в социальных сетях -, Свидетельство № 2021669731. Зарегистрировано в Реестре программ для ЭВМ 02.12.2021. (год публикации - )

9. Коломеец М.В., Чечулин А.А., Котенко И.В. Модуль обнаружения ботов в социальной сети на основе анализа графов социального взаимодействия -, Свидетельство № 2021667921. Зарегистрировано в Реестре программ для ЭВМ 08.12.2021. (год публикации - )

10. Левшун Д.С., Тушканова О.Н. Компонент для итеративного обучения при анализе тематики текста -, Свидетельство № 2021667921. Зарегистрировано в Реестре программ для ЭВМ 08.11.2021. (год публикации - )

11. - Сотрудники Следственного комитета России прошли курсы по киберкриминалистике Петербургский Дневник, Петербургский Дневник.10 декабря 2021 года. (год публикации - )

12. - Для СК разработали курсы по киберкриминалистике ТАСС, ТАСС.10 декабря 2021 года. (год публикации - )

13. - Ученые научились выявлять ботов в соцсетях по социальным связям Российская газета, Российская газета. 23 августа 2021. (год публикации - )

14. - Роботы против людей: эволюция ботов в социальных сетях Бумага, Просветительский фестиваль "Кампус", 19 февраля 2022 года (год публикации - )

15. - Итоги года: РНФ и «Коммерсант» рассказали о ярких результатах исследований российских ученых Коммерсант, 31 декабря 2021 (год публикации - )


Аннотация результатов, полученных в 2022 году
Данное исследование направлено на изучение видов информационных атак в социальных сетях, в которых принимают участие боты, а также способов их детектирования и характеризации. В рамках исследования была разработана модель информационной атаки в социальной, которая содержит новые классы, атрибуты и отношения между ними, характеризующие информационные атаки в процессе распространения информации в медиа. Модель информационных атак является концептуальной и позволяет применять подходы машинного обучения для мониторинга и обнаружения вредоносного влияния в информационном пространстве социальных сетей. Модель содержит следующие элементы: (1) факт; (2) номинация; (3) событие; (4) медиа-фрейм; (5) медиа; (6) вектор информационной атаки; (7) пространство информационных атак. Модель информационных атак демонстрирует, как атака проходит через процесс медиатизации. На базе модели предложен подход к обнаружению и выбору признаков информационной атаки. Для проверки предложенных модели и подхода проведено тематическое исследование. Для разработки модели информационной атаки были проведены консультации с экспертами со стороны социо-гуманитарных наук. Была разработана классификация видов и характеристик информационных атак с применением ботов, а именно: Классификация информационных атак с учетом интересов организатора атаки: (1) Конфликт: a) вооруженный; б) экономический; в) репутационный. (2) Конкуренция: а) брендов; б) субъектов; в) корпораций. (3) Флуктуация: а) ошибка; б) заблуждение; в) привлечение внимания; г) отвлечение внимания (спиннер). Классификация действий характерных для информационных атак, реализуемых в интересах организатора: (1) Распространение информации: а) интерпретация факта; б) формирование сообщения; в) выбор медиа; г) публикация сообщения; д) репост сообщения; е) цитата сообщения. (2) Управление атакой в информационным пространстве: а) формирование задания; б) лайк; в) дизлайки; г) подписка; д) комментарии; е) просмотры. Классификация информационной атаки по интересам организатора и по типам ботов (технические боты, боевые боты, тролли, дезинформаторы и спамеры), классы информационных атак (конфликт, конкуренция, флуктуация) и вероятность реализации сценария информационной атаки с применением таких ботов в социальных сетях Были разработаны алгоритмы оптимизации сбора исходных данных для извлечения характеристик информационной атаки, а именно: – алгоритм случайного сбора и экстраполяции результатов, который позволяет оценить среднее количество и характеристики ботов в группе анализируемых аккаунтов (применяется при общей оценке картины зараженности ботами). Алгоритм случайного сбора основан на экстраполяции выводов о репрезентативной выборки на генеральную совокупность. – алгоритм ранжированного сбора и анализа результатов, который позволяет оценить количество и характеристики ботов по смещенной выборе, со смещением в сторону большей активности, большего охвата и других метрик влияния (степени информационного воздействия). Вместо того, чтобы анализировать все аккаунты, предлагается определить пользователей, которые оставили больший цифровой след (оставили больше всего сообщений, охватили большую аудиторию, получили больше других лайков и т. п.). В зависимости от сценария использования (мониторинг социальной сети в целом, целевой мониторинг) предполагается использовать тот или иной алгоритм. На предыдущем этапе проекта были выбраны характеристики ботов, которые можно использовать как метрики атаки. На основе разметки собранных наборов данных, включая разметки от 3-ех экспертов, проведенных экспериментов и собранных признаков были рассчитаны корреляции Спирмена между метриками ботов. Анализ показал, что: (1) Чем больше вероятность распознать бота - тем меньше цена, быстрее скорость бота, меньше экспертное качество, а сам бот вероятно покупался через магазин, а не биржу. Что в целом сходится с ожидаемыми характеристиками ботов низкого качества, а также то, что пустые аккаунты чаще блокируются соцсетью. (2) Наборы данных, в которых много пустых/заблокированных аккаунтов чаще приобретены в магазинах, а не на биржах, они обладают высокой скоростью, и хорошо распознаются людьми. (3) метрики price, speed, seller_type взаимно коррелируют, за исключением корреляции цены с типом продавца. (4) экспериментальное качество не имеет среднюю или сильную корреляцию по Чеддоку с какой-либо одной метрикой, полученной в ходе закупки ботов. В целом, можно сделать вывод, что на успешность атаки влияет сразу множество факторов, и для ее описания нужно использовать сразу несколько метрик. Данные метрики легли в основу создания методов характеризации ботов, а на данном этапе легли в основу идентификации характеристик атак. Исходя из данных метрик в настоящем исследовании было предложено рассчитывать характеристики информационной атаки: стоимость атаки; сложность атаки; скорость атаки; объем атаки; успешность атаки. Была разработана интегральная методика обнаружения ботов и извлечения характеристик включает в себя этапы сбора данных, обнаружения ботов и расчёта характеристик атаки, которые были разработаны на предыдущем и данном этапах проекта и включает: – Сбор данных. – Фильтрация по признакам модели атак. Исходя из цели анализа перед сбором данных аккаунта применяется фильтрация с использованием классификатора, которая позволит выделить элементы модели атак (номинацию, вид медиа, медиа фрейм, и т. п.) – Обнаружение ботов. Исходя из собранных данных аккаунты классифицируются с использованием методов обнаружения ботов – Расчёт метрик. Для аккаунтов, которые были определены как боты рассчитываются метрики ботов и атаки. Для проведения экспериментов был разработан программный прототип системы обнаружения и характеризации информационных атак ботов, которые может работать в двух режимах: – Мониторинг социальной сети в целом. – Мониторинг целевого сообщества в социальной сети. В рамках проекта с использованием систем сбора были также собраны наборы, которые в последствии использовались для обучения моделей и проведения экспериментов. С использованием собранных наборов данных были разработаны классификаторы, которые позволяют определить элементы модели атак: – Отношение к тематике X (бинарная классификация – относится/не относится). Модель, которая позволяет отфильтровать сообщения релевантные к тематике X. – Поддержка стороны (мульти-классификация – поддерживает сторону X, Y или невозможно установить). Также для анализа тональности использовалась модель DeepPavlov ruBertBaseCasedSentiment. Для оценки эффективности разработанных решений было проведено 3 эксперимента соответствующие режимам работы прототипа. Были разработаны предложения для возможного применения, которые включают в себя следующие сценарии: -- Система обнаружения и оценки характеристик информационных атак, реализуемых при использовании ботов в социальных сетях в интересах одной из сторон конфликта -- Система противодействия информационным атакам в условиях конфликта. -- Система мониторинга и анализа социальных медиа и СМИ, для повышения осведомленности бренда, субъекта или корпорации в процессе управления рекламными и репутационными компаниями. -- Система мониторинга и анализа социальных медиа и СМИ, для защиты пользователя от манипуляций и вовлечения в процесс информационной атаки в ходе дезинформации, распространения фейков, индуцированной активности и искусственной медиатизации. Также были опубликованы 10 работ, в том числе две публикации, входящие в 1-й квартиль базы цитирования Scopus, и получен 1 сертификат о государственной регистрации программ. В процессе исследования участники проекта также принимали участие в популяризации его результатов. Так, о результатах проекта выпустили публикации ряд СМИ.

 

Публикации

1. Виткова Л.А., Коломеец М.В., Чечулин А.А. Taxonomy and Bot Threats in Social Networks Proceedings of the International Russian Automation Conference (RusAutoCon, Sochi, Russia, 04-10 September 2022)., IEEE, 2022. (год публикации - 2022) https://doi.org/10.1109/RusAutoCon54946.2022.9896268

2. Гавра Д.П., Акимович Е.В., Балахонская Л.В., Виткова Л.А., Балахонский В.В. Communication Strategy of Politicization of a Sports Incident in Modern Media Space Proceedings of the 2023 Communication Strategies in Digital Society Seminar (2023 ComSDS), P.29-36 (год публикации - 2023)

3. Коломеец М.В., Десницкий В.А., Котенко И.В., Чечулин А.А. Graph Visualization: Alternative Models Inspired by Bioinformatics Sensors, Vol. 23, Iss. 7, № 3747 (год публикации - 2023) https://doi.org/10.3390/s23073747

4. Коломеец М.В., Чечулин А.А. Social bot metrics Social Network Analysis and Mining, Vol 13, Iss 36 (год публикации - 2023) https://doi.org/10.1007/s13278-023-01038-3

5. Коломеец М.В., Чечулин А.А. Метрики вредоносных социальных ботов Труды учебных заведений связи, Вып. 9, №1, 94-104 (год публикации - 2023) https://doi.org/10.31854/1813-324X-2023-9-1-94-104

6. Коломеец М.В., Чечулин А.А., Виткова Л.А. Technique for investigating attacks on a company's reputation on a social media platform Studies in Computational Intelligence book series, Intelligent Distributed Computing XV. IDC 2022. Studies in Computational Intelligence, vol 1089. Springer, Cham. P.234-243. (год публикации - 2023) https://doi.org/10.1007/978-3-031-29104-3_26

7. Виткова Л.А. Информационные атаки в социальных сетях Юбилейная XVIII Санкт-Петербургская Международная конференция Региональная информатика (РИ-2022). Материалы конференции, стр. 145-147 (год публикации - 2022)

8. Виткова Л.А. Анализ профилей в социальных сетях в целях информационной безопасности Конференция «Информационные технологии в управлении» (ИТУ-2022). Сборник материалов, стр. 249-250 (год публикации - 2022)

9. Виткова Л.А. Оценка угроз в социальных сетях при использовании ботов Конференция «Информационные технологии в управлении» (ИТУ-2022). Сборник материалов, стр. 246-248 (год публикации - 2022)

10. Коломеец М.В. Методика разметки метрик ботов социальных медиа Конференция «Информационные технологии в управлении» (ИТУ-2022). Сборник материалов, стр. 234-237 (год публикации - 2022)

11. Коломеец М.В, Чечулин А.А. Компонент обнаружения метрик ботов в социальной сети -, № 2022681600 от 15.11.2022 (год публикации - )

12. Коломеец М.В, Чечулин А.А. Компонент глобального мониторинга активности ботов в социальной сети -, № 2022681601 от 15.11.2022 (год публикации - )


Возможность практического использования результатов
На предыдущем этапе данного проекта (и в предыдущем проекта) предложения по внедрению полученных результатов на практике традиционно делились по смыслу на несколько уровней: (1) государство, (2) город, (3) рекламные компании, (4) системы защиты информации. Частично сценарии возможного применения предлагаемых решений и теоретическая оценка практической пользы от их применения приведена в разделе 9 данного отчета. На текущем этапе проекта научно-технические предложения разрабатывались с учетом классов информационных атак, реализуемых организатором при использовании ботов в социальных сетях: 1. Конфликт. 2. Конкуренция. 3. Флуктуация. А также с учетом метрик оценки: 1. Стоимость атаки - это выявленная, разработанными в проекте алгоритмами стоимость найденных ботов. 2. Сложность атаки - эта метрика, позволяет определить насколько сложные технологии использовались для создания ботов. Также данная метрика позволяет понять, насколько сложные меры противодействия необходимо реализовывать. 3. Скорость атаки - метрика, которая позволяет определить маневренность атакующего, и сколько времени есть на реализацию контрмер. 4. Объем атаки - метрика, которая позволяет определить зараженность ботами исходя из соотношения ботов и всех аккаунтов. 5. Успешность атаки - метрика, которая показывает вероятность того, что пользователь поверит боту. Так, разработанные в проекте модели, алгоритмы, методики, программные компоненты и архитектура могут быть использованы для следующих решений: • Система обнаружения и оценки характеристик информационных атак, реализуемых при использовании ботов в социальных сетях в интересах одной из сторон вооруженного, экономического или репутационного конфликта. Предложенные в проекте модели и алгоритмы позволяют оценить семантический фрейм, вычислить примерные расходы противника в конфликте на информационную атаку, сложность атаки (качество ботов, алгоритмы генерации текста, модели управления ботами), скорость распространения, характерную для атаки, ее объем и успешность для стороны в конфликте. • Система противодействия информационным атакам в условиях вооруженного, экономического или репутационного конфликта. Так, например, интегральная методика обнаружения и извлечения характеристик информационной атаки, проводящейся с помощью ботов, позволяет определить скорость информационной атаки, оценить уровень доверия информации (успешность). Модель и классификация информационных атак позволяют выявить ситуационный фрейм, интересы организатора, в которые укладывается информационная атака. А все предложенные решения вместе повышают уровень осведомленности, а значит и эффективность выбранных контрмер одной из сторон в конфликте. • Система мониторинга и анализа социальных медиа и СМИ. Существующие системы показывают количество просмотров, комментариев, сообщений, отметок мне нравится в информационном поле по ключевым словам, заданным специалистами по рекламе бренда, субъекта или корпорации. Разработанные в проекте модели, алгоритмы и методики могут быть интегрированы в такие системы и позволят вовремя обнаруживать искусственную медиатизацию, появление сообщений, не прикрепленных фактами и относить такие материалы к элементам информационной атаки на бренд, на имя субъекта или на корпорацию. • Система мониторинга и анализа социальных медиа и СМИ как элемент системы защиты пользователя. Например, обнаружение информационной атаки, реализованной при использовании ботов позволяет определенным образом маркировать все сообщения, которые связаны по семантическому фрейму или по группе пользователей, таким образом рекомендовать пользователю критически относиться к информации в социальной сети. При этом, своевременное предупреждение пользователя о наличии элементов информационной атаки позволит замедлять распространение информации. • Программы подготовки кадров - разработанные модели, алгоритмы и методики могут быть частью образовательной программы, в том числе в рамках повышения уровня цифровой гигиены современного общества, а также для подготовки квалифицированного персонала в маркетинге, в PR, в журналистике и в области информационной безопасности (защита от информации).