Данные данными погоняют
Госстатистику готовят к обмену быстрых цифр на верные
Правительство обсуждает дальнейшую модернизацию системы сбора и обработки данных Росстатом. Официальную статистику планируется ускорить за счет межведомственного обмена данными и расширения набора используемых сведений, в том числе больших данных, а последние, в свою очередь, предполагается приводить к пригодному для статистики качеству и детализации. Подходы к этому уже апробируются на практике, но сложности их реализации связаны с отсутствием единообразия информации, что, в частности, планируется решать за счет стандартизации качества данных для госорганов и модернизации работы Росстата.
Глава Росстата Сергей Галкин в 2019 году
Фото: Дмитрий Духанин, Коммерсантъ
Вчерашнюю стратсессию правительство посвятило развитию статистики. По словам премьер-министра Михаила Мишустина, на основе данных, как «ключевого ресурса», госорганы принимают решения и строят прогнозы, а предприятия составляют бизнес-стратегии и инвестпрограммы. Официальная же статистика основывается на международных методиках, которые «не всегда отражают возможности, которые привнесла цифровая трансформация и технологический прогресс», посетовал премьер.
Без международной методологии российская статистика утратит сопоставимость с данными других государств. Де-факто Росстат оказывается в положении, когда он выступает и поставщиком «официальных» данных для госуправления (бюджетного планирования, промышленной и социальной политики, экономического прогнозирования и т. д.), и потребителем ведомственной и коммерческой информации в ведении госорганов. При этом, по словам Михаила Мишустина, хотя служба поставляет правительству более половины данных, информсистемы 63 госорганов, статистическую работу которых он координирует и на которую опирается, как правило, строятся «по своей методологии и на своих технологических и организационных решениях». Осложняет ситуацию и то, что часть данных собирается Росстатом вручную (например, по ценам и переписи), на бумаге (например, по миграции), а из существующих источников ведомственных данных только часть попадает в статистическую обработку.
Важность и сложность задачи развития статучета увеличивает постоянное расширение использования данных в госуправлении — для этого Белый дом активно развивает ГАС «Управление» (см. “Ъ” от 9 января), являющуюся центральным звеном взаимодействия госорганов при использовании ведомственных ГИС и баз данных.
Для повышения качества, сопоставимости и «скорости производства» статданных правительство считает необходимым наладить межведомственный обмен, а также использование «всех имеющихся источников».
Однако вопрос о том, кто должен адаптироваться к ситуации избытка данных — связанный методологией Росстат или поставщики информации,— пока, по данным “Ъ”, единого ответа в Белом доме не имеет, хотя невозможность решить его в рамках одной статслужбы или без ее участия выглядит очевидной.
По словам федерального чиновника, участвовавшего в стратсессии, важна донастройка работы Росстата — в частности, служба может модернизировать свои системы для максимального использования административных данных, а также расширять свои возможности как государственного «дата-сайентиста». Это в том числе должно снизить и отчетную нагрузку на бизнес — сведения в Росстат поступают от более чем 7 млн хозяйствующих субъектов по сотням форм только на федеральном уровне. По оценкам Белого дома, примерно пятая их часть многократно направляется в разные ведомства — в связи с этим разработан законопроект по сокращению статистической отчетности бизнеса (см. “Ъ” от 15 февраля).
Однако пилотные проекты по включению службы госстатистики в работу единой облачной платформы и предоставления ей оперативной информации, имеющейся у ФНС и ПФР (см. “Ъ” от 24 марта 2020 года), выявили те же проблемы, что ранее возникали у ФНС (при создании единого реестра населения) и Минфина (при попытке каталогизировать все, что государство покупает при госзакупках),— в том числе отсутствие единой для экономики номенклатуры товаров и услуг и расхождение наборов данных, вынуждающее искать дополнительные источники. Так, например, при оценке потенциала использования данных контрольно-кассовой техники для расчетов инфляции узким местом оказалось отсутствие единых справочников товаров и услуг и отсутствие в данных ККТ адреса точки продажи. Идея же внедрения в ряд действующих ГИС всех обязательных для статистических нужд полей позволила сформировать набор показателей, которые могут рассчитываться таким образом, но задача упирается в распространение стандарта качества данных, который устроит и статистиков, и чиновников.
Как эксперты оценивают планы по реформированию статистики
Руководитель группы социально-экономических исследований Агентства трансформации и развития экономики (АТРЭ) Виктория Павлюшина отмечает, что сейчас статистика зачастую отстает от развития экономики: например, в классификаторе продукции по видам деятельности пока отсутствуют «новые» виды товаров, в частности цифровые. Однако, отмечает она, некоторые успехи в части статучета уже можно отметить — например, сбор данных из множества различных ведомственных баз данных для оценки значений показателей национальных целей. «Реформа статистики ресурсозатратна во всех смыслах»,— говорит эксперт. Кроме того, процесс потребует значительной аналитической и методологической работы, донастройки ведомственных систем, в том числе увеличения технических возможностей хранения и обработки данных.
Как отмечает экс-руководитель Росстата, директор по статистическим исследованиям НИУ ВШЭ Александр Суринов, федеральные органы собирают достаточно большой объем информации, и «надо использовать это богатство рационально, не тратить деньги на сбор информации, которая уже собрана, и не мучить респондентов одними и теми же вопросами» — для этого национальная статистика должна иметь доступ к таким данным. «Например, в скандинавских странах от респондентов собирается мало информации — основная часть сведений для статистики поступает из административных регистров. Есть другие, где ситуация обратная. Россия же находится где-то посередине, со многими ведомствами уже есть хорошее взаимодействие»,— говорит он.
Сама проблема, добавляет Александр Суринов, довольно сложно решается по разным причинам — в частности, есть методологическая проблема, связанная с тем, что ведомства собирают данные для выполнения своих функций и информация зачастую требует переработки в соответствии с методологией (например, у Росстата и налоговой есть некоторая разница в понимании данных по оплате труда). Использование же больших данных, которые формируются частным бизнесом спонтанно, без использования официальных классификаторов, также требует решения методологических проблем — статистика их должна «переварить» для квалифицированного использования, определив, какие данные подходят для целей статистики, и переработав их в соответствии с методологией. «Если большие данные удастся вовлечь и сделать их серьезным источником первичной информации, это будет здорово — они решают проблему скорости и могут детализированно представлять социально-экономические явления»,— считает он.
Руководитель Российского центра компетенций и анализа стандартов ОЭСР РАНХиГС Антонина Левашенко поясняет, что модернизация статистики — «это процесс, который требует последовательной реформы методологических подходов и значительных ресурсов для увеличения охвата обследований и качественного сбора статистики». В частности, полагает она, важно устранять барьеры для обмена данными как между различными государственными органами, так и между государством и бизнесом — например, сегодня для измерения данных о доходах населения решающее значение может иметь получение данных от Сбербанка о доходах и платежах населения, однако для этого требуется более системная работа на федеральном уровне.