Банк России представил для общественных консультаций доклад «Состояние и перспективы развития систем управления данными участников финансового рынка» — обследовав более 100 организаций, регулятор выяснил, что развитие их систем управления данными сильно фрагментировано, при этом самая большая доля респондентов (36%) относится к начальному уровню их применения. Особое внимание в докладе регулятор обращает на проблему качества данных — ему достоверные и актуальные сведения необходимы для принятия адекватных системных решений. Эксперты, однако, отмечают, что самим банкам такое качество информации для обычной работы может быть ненужным.
Фото: Игорь Иванко, Коммерсантъ
Только 30% финансовых организаций обладают эффективным уровнем зрелости систем управления данными, выяснил Банк России в ходе проведенного обследования. Доля организаций на «развивающемся» уровне составляет 34%, на «начальном» — 36%. Распределение по группам регулятор проводил на основании нескольких критериев, в том числе оценивая отношение респондентов к ценности данных и приоритет их качества и аналитики. Также в ЦБ разделили организации по трем группам по уровню дисциплины и качеству регуляторной отчетности: более половины (55%) делают среднее количество ошибок и обладают средней дисциплиной, 26% — большое количество ошибок при низкой дисциплине, и лишь 18% — дисциплинированы и редко ошибаются. В качестве метрик использовалось число ошибок при обязательном контроле, пересдач документов по инициативе организаций или несвоевременных сдач отчетности.
«Целевым состоянием систем управления данными является нахождение большинства участников финансового рынка на таком уровне зрелости, который позволяет раскрыть максимальный потенциал использования данных, отвечающих требованиям к качеству, достоверности, скорости обработки и доступности, а также современным технологическим вызовам»,— говорится в докладе (.pdf). Ссылаясь на работы ряда исследователей, в Банке России отмечают, что данные стали современными средствами производства и должны быть доступными и качественными.
«В то же время две трети команд разработчиков жалуются на низкое качество данных, а каждая вторая команда — на недостаток данных или их наличие в неподходящем формате»,— сетуют авторы доклада. Бороться с этим ЦБ намерен развитием методологии и типовых документов. Однако запросы рынка также разнятся. «Кто-то проводит детальный бизнес-анализ внутри своей организации и нуждается в референсной модели данных, кто-то полагается на производителей программного обеспечения и сервисов»,— признают в Банке России.
По словам эксперта научно-учебной лаборатории методов анализа больших данных НИИУ ВШЭ Юрия Пахомова, ошибки бывают разного рода, и важно отметить, что они могут быть вызваны разными причинами — характером операционной деятельности, несовершенством IT-инфраструктуры, управленческими практиками.
Решений у проблемы качества данных также множество — начиная от внедрения практик контроля за качеством данных на этапе их сбора до его автоматизации, контроля первоисточников и т. д. и в принципе заканчивая переходом к дата-ориентированности компаний, когда собираемые данные используются во внутренней аналитике, полагает председатель Ассоциации участников рынка данных Иван Бегтин.
«Качество данных, которыми оперируют в том числе и финансовые структуры РФ, достаточно низкое»,— соглашается технический директор DIS Group Олег Гиацинтов. Часть вопросов, связанных с качеством, можно решить, оптимизируя бизнес-процессы, однако собственные метрики качества, которые применяют у себя участники финансового рынка, зачастую отличаются от тех метрик, которые выставляет ЦБ. По словам эксперта, есть две причины: первая — у обычного банка в текущих условиях может не быть технической возможности обеспечения необходимого аналитикам ЦБ уровня качества данных, однако зачастую бизнесу и не требуется такое же высокое качество. Вторая — решений по управлению качеством данных (решения класса Data Quality) зачастую недостаточно для необходимого уровня качества по каждой из метрик — нужны также решения по управлению данными (решения класса Data Governance).