Официальная статистика мечтает о big data
Глава Росстата рассказал о планах и надеждах ведомства
Статистическое ведомство одним из первых провело в этом году итоговую коллегию, на которой глава Росстата Александр Суринов рассказал о своих результатах и планах на ближайшие три года. Росстат, по его словам, вошел в десятку лидеров по уровню открытости среди госсайтов, профессия статистика по-прежнему актуальна. Однако чтобы сохранить роль главного источника статданных, необходимо введение централизованной системы обработки данных (ЦСОД), которую служба намерена запустить в этом году. Также в ведомстве хотели бы получить доступ к big data, собираемым коллегами по правительству, ради большей детализации статистики.
Глава Росстата Александр Суринов представил результаты деятельности своей службы в 2016 году и обозначил планы до 2019 года. По его словам, традиционная «отчетность» утрачивает роль доминирующего источника статистических данных, а работникам его профессии приходится конкурировать с аналитиками. Для соответствия современным запросам Росстат намерен создать «систему открытой статистики для обслуживания информационных потребностей гражданского общества», снизить статистическую нагрузку на бизнес и население и использовать big data в официальной статистике.
Отвечая на критику пересмотров оценок ведомством данных прошлых лет — и в частности, значительное улучшение постфактум динамики падения российского ВВП по итогам 2015 года с первоначальных 3,7% до 2,8% — господин Суринов объяснил позитивные изменения статистики тем, что данные для анализа в Росстат поступают постепенно на протяжении двух лет. «Когда мы первые оценки делаем, это не то, чтобы прогноз, но некая оценка, основанная на небольшом объеме информации. Там больше гипотез. Потом появляются утвержденные данные о государственном бюджете, потом утвержденные данные о бюджетах внебюджетных фондов. В конце года получаем конечную информацию об объемах производства валового продукта сельского хозяйства и так далее»,— рассказал он, добавив, что вносят коррективы и итоги проверок контрольных органов.
При этом процесс составления статистических данных замедляет и недостаточное межведомственное взаимодействие — глава Росстата пожаловался на то, что ряд ведомств не открывает допуск к своим первичным данным в целях статистики. Он привел в пример Федеральную налоговую службу (ФНС), которая не допускает Росстат к своим базам данных и предоставляет информацию сама, в отличие от Федеральной таможенной службы (ФТС), к базам которой Росстат имеет доступ и может использовать их самостоятельно в целях статистики. Кроме того, в статведомстве рассчитывают получить доступ и к базам данных МВД. Также ведомству не хватает большей степени детализации. Глава Росстата привел примеры последних запросов, которые пока сложно исполнить: «Сколько в городах Подмосковья потребляется охлажденной трески, минтая, окуня и прочее? Каковы ключевые показатели регионов по видам деятельности “инженерные изыскания в строительстве”» и т. п.
Впрочем, несмотря на отсутствие необходимой детализации, Росстат продолжает оставаться в перечне лидеров по уровню открытости. Коэффициент информационной доступности Росстата в 2016 году устойчиво возрастал: с 48% в марте до 89% в декабре. Этот индикатор демонстрирует соответствие открытых информационных ресурсов ведомства по более чем тремстам техническим требованиям автоматизированной информационной системы «Мониторинг госсайтов».
Не только глубина сбора статистики требует пересмотра. Система Росстата по инерции фокусируется на работу с традиционными «предприятиями», хотя реальная информация сейчас аккумулируется в других центрах принятия решений — в головных офисах групп. В результате теряется целостное видение одного из доминантных секторов экономики. Глава Росстата приводит в пример ФНС, которая «уже давно создала организационную структуру для работы с крупнейшими налогоплательщиками», сообщив, что статистики также начали работу над образованием подразделения для работы с крупными многотерриториальными компаниями.
В целом, существенно изменить работу госстатистиков должна намеченная централизация рабочих процессов. Первичные данные будут передаваться для обработки на федеральный уровень. Туда же будет постепенно передаваться проведение макрокорректировок («дорасчетов») и составление балансов. «Централизация производства должна обеспечиваться современными техническими решениями, включая использование облачных сервисов, российского и свободного программного обеспечения, сетей передачи данных для госорганов и центров обработки данных (ЦОД)»,— говорит господин Суринов. По его словам, в этом году будет внедрена ЦСОД по унифицированным формам федерального статистического наблюдения.