МИР вашему контенту
Роскомнадзор донастроит свою систему мониторинга интернета
Роскомнадзор через подведомственную структуру объявил тендер на доработку систем мониторинга интернета для выявления противоправных материалов. Речь идет о доработке информационной системы мониторинга интернет-ресурсов (ИС МИР) в части ее интеграции с новыми системами — «Чистый интернет» и «Окулус», а также добавлении в механизм мониторинга ботнетов для сбора данных в соцсетях.
Фото: Анатолий Жданов, Коммерсантъ
ФГУП «Главный радиочастотный центр» (ГРЧЦ, подведомствен Роскомнадзору) 28 сентября разместил на портале госзакупок тендер на доработку ИС МИР, которая работает с 2021 года, а также интеграцию ее с новой автоматизированной системой «Чистый интернет» (АС ЧИ) и системой выявления нарушений в изображениях и видеоматериалах с использованием нейросетей (ИС «Окулус»). Из технического задания следует, что работы проводятся для увеличения охвата анализируемых материалов, выявления «сложных признаков нарушений законодательства» и сокращения времени на выявление запрещенной информации в сети (с 10 тыс. запросов на сбор по каждой социальной сети в час минимум до 20 тыс.).
Систему «Окулус» Роскомнадзор запустил в феврале. В ведомстве объясняли, что «Окулус» распознает изображения и символы, анализирует текст и может автоматически находить экстремистские материалы, призывы к массовым беспорядкам, суициду, употреблению наркотиков и пропаганду ЛГБТ (см. “Ъ” от 13 февраля). Система способна обрабатывать 200 тыс. изображений в сутки. В первом полугодии Роскомнадзор заблокировал более 885 тыс. сайтов, что на 85% больше, чем за аналогичный период 2022 года.
В тендерной документации ГРЧЦ прописано, что АС ЧИ должна включать подсистему «Бот-ферма», которая позволит, например, автоматизировать создание и ведение аккаунтов в соцсетях для дальнейшего скачивания необходимых системе материалов из сети.
АС ЧИ необходимо синхронизировать и с работой ИС «Окулус». Модернизация систем необходима ГРЧЦ, чтобы в том числе обновить мониторинг под версии девяти сервисов: «ВКонтакте», «Одноклассники», «Мой Мир», «Ответы@mail.ru», Dzen (входит в VK), LiveJournal, YouTube, Likee и Yappy («Газпром-медиа»), а также каналов мессенджера Telegram. В Роскомнадзоре и ГРЧЦ отказались от комментариев.
В техзадании к тендеру подразумевается увеличение источников информации, в том числе в направлении мессенджеров, а в дальнейшем, возможно, и даркнета, говорит руководитель компании «Интернет-розыск» Игорь Бедеров. Иными словами, деньги направляются на увеличение мощностей индексации информации на тех или иных ресурсах, уточняет он.
Что касается «Бот-фермы», то речь, возможно, идет о построении ботнетов (сетей из искусственных автоматизированных пользователей). «Они необходимы, чтобы более эффективно собирать данные — без регистрации пользователь не может увидеть всю информацию на странице в соцсети,— а также для попадания в закрытые каналы и чаты»,— объясняет Игорь Бедеров.
Увеличение масштаба обработки данных потребует значительных вычислительных ресурсов и хранилищ данных, что ведет к серьезным вложениям в оборудование и инфраструктуру, предупреждает директор центра разработки Artezio (ГК «Ланит») Дмитрий Паршин. Если говорить о получении данных из соцсетей с помощью ботнета, то мало создать алгоритмы для автоматической регистрации и ведения аккаунтов, нужно еще обходить защиту платформ от активности ботов, напоминает эксперт.