Европейский университет поставил нейросеть в полиции
Санкт-петербургские ученые изучили криминальную статистику с помощью алгоритмов Facebook
Санкт-петербургские ученые провели нейросетевой анализ «типовых сценариев обращения граждан в правоохранительные органы». С этой целью сотрудники Европейского университета (ЕУ) в Санкт-Петербурге исследовали 4,4 млн обращений в полицию, получив доступ Генпрокуратуры к государственной автоматизированной системе правовой статистики (ГАС ПС). Чаще всего россияне сообщают о бытовых происшествиях (22,5% от общего количества обращений), потерях и кражах (10,3%). О ДТП и смертях сообщений примерно поровну — почти 4,5%.
Сотрудники института проблем правоприменения Европейского университета с помощью нейросетей исследовали 4,4 млн сообщений об обращении граждан в правоохранительные органы с 2013 по 2017 год. Данные о сообщениях ученые взяли из ГАС ПС, которая на данный момент используется в 27 регионах страны.
Доступ к данным ученым предоставила Генеральная прокуратура РФ, которая с 2013 года занимается администрированием системы. В систему заносится краткая информация от граждан, обратившихся с сообщением о происшествии: часть сообщений в дальнейшем становится поводом для возбуждения уголовных дел, часть — административных, остальные уходят в архив. До 2013 года все обращения граждан в правоохранительные органы заносились оперативным дежурным от руки в специальный журнал, поэтому провести масштабный анализ данных не представлялось возможным.
Работа с системой позволила ученым проанализировать первичные данные, появляющиеся до того, как правоохранительные органы приняли решение придать обращению статус сообщения о правонарушении.
Сотрудники ЕУ смогли научить машину делить все сообщения от граждан на содержательные категории, предварительно исключив из базы дубликаты (часто одно сообщение попадает в несколько ведомств).
Официальная статистика, как правило, такие дубликаты считает отдельными сообщениями, формально увеличивая общее количество обращений от граждан.
Используя алгоритмы, с которыми, по словам сотрудников ЕУ, работает Facebook, ученые обучили машину распознавать и выделять слова внутри контекста. Это позволило автоматически разделить все 4,4 млн сообщений от граждан на 40 смысловых кластеров. Выяснилось, что чаще всего россияне сообщали о бытовых происшествиях (22,5% от общего количества), потерях и кражах (10,3%), ДТП (4,4%), смертях (4,3%) и экономических преступлениях (4,2). Для анализа сообщения без применения нейросети потребовался бы год непрерывной работы, говорят в ЕУ.
Ученые ЕУ считают, что именно изучение сообщений о происшествиях до того, как они обретут статус правонарушений, может помочь приблизиться к пониманию реального уровня преступности.
«Основной предмет исследования — то, как люди мобилизуют право. Мы хотели понять, как люди общаются с полицией и каковы типовые сценарии их обращения в правоохранительные органы»,— пояснил “Ъ” руководитель проекта, сотрудник института правоприменения ЕУ Дмитрий Скугаревский.
Кроме того, по словам авторов исследования, с помощью разработанной ими классификации можно будет следить, какого типа правонарушения на конкретной территории происходят чаще всего.
«Такая база со смысловыми кластерами может дать общую картину происходящего в тех или иных регионах. Вероятно, на основании этого правоохранительные органы смогут следить, какие тенденции имеются на местах. Стоит также попробовать соотнести полученные данные с официальными»,— сказал “Ъ” юрист «Дювернуа Лигал» Игорь Гущев.
По словам Дмитрия Скугаревского, именно прокуратура, предоставившая доступ к системе, наиболее заинтересована в том, чтобы иметь реальные данные о количестве преступлений и видеть картину целиком.