Вопрос о данных созрел
Модель их использования в госуправлении должна быть выбрана в новом году
Одним из приоритетов работы в 2022 году глава Минцифры Максут Шадаев обозначил создание единого государственного data lake (озеро данных) и запуск маркетплейса дата-сетов, а значит, в следующем году властям придется решать вопросы регулирования данных. Еще в 2018 году тогда «цифровой» вице-премьер Максим Акимов поднял вопрос о формировании общенациональной архитектуры данных, которая обеспечивала бы семантическую возможность общения систем и в равной степени отвечала бы потребностям бизнеса и государства. И вот теперь, считает корреспондент отдела экономической политики Венера Петрова, настало время определиться с моделью использования данных: без этого цифровая трансформация в госуправлении все равно невозможна.
2022 год обещает быть годом регулирования данных — решения в этой сфере требуют большого поиска компромиссов, что дается обыкновенно не очень просто
Фото: Анатолий Жданов, Коммерсантъ
Data lake позволит в том числе собирать обезличенные данные с регионов, муниципалитетов и на их основе проводить расширенную аналитику. И вот тут возникает проблема — законопроект о порядке обезличивания персональных данных был внесен правительством в Госдуму еще летом прошлого года, но до сих пор документ не принят — прошел только первое чтение в феврале этого года. А между тем это один из самых чувствительных вопросов и для государства, и для бизнеса. Обезличенные данные — основа для технологий искусственного интеллекта (ИИ), на них будет строиться обучение нейросетей. Кроме того, обезличивание персональных данных необходимо, чтобы избежать их утечки: опрос ВЦИОМа показал, что большинство россиян (74%) считают себя не защищенными от кражи и утечек персональных данных.
Решению вопроса препятствует в том числе периодически меняющаяся позиция регуляторов, полагают эксперты.
Так, например, во второй версии доработанного Минцифры ко второму чтению документа появился пункт о создании государственных центров хранения обезличенных персональных данных — все российские операторы персональных данных должны будут передавать туда данные в обезличенном виде. При этом неожиданным для бизнеса было и предложение Минцифры отдавать данные на безвозмездной основе — это может затормозить развитие рынка больших данных и проектов в области ИИ.
Документ отправлялся в правительство в марте дважды, а в мае произошла его третья трансформация — бизнесу разрешили обезличивать персональные данные россиян без их согласия. При этом изначально внесенный в Госдуму законопроект предполагал упрощение порядка сбора бизнесом согласий с граждан на обработку их персональных данных. В доработанной ко второму чтению версии документа лишь появилось условие, что данные россиян компании могут обезличивать при получении отдельного согласия граждан. Согласно третьей версии, компании должны будут передавать данные государству, но использовать их для разработки сервисов ИИ можно будет только через три года — по мнению экспертов, это вариант компромиссный.
Что ж, в очередной раз мы видим, как меняются правила игры по ходу пьесы. И это создает двоякое ощущение: с одной стороны, можно наблюдать спешку в этом вопросе, что говорит о желании ведомства выполнить в срок очередное поручение, а с другой — к мнению бизнеса все же прислушиваются, пусть и спустя время. Но, конечно, это не создает избыточного доверия к действиям государства. Впрочем, кажется, что вопрос о бесплатной передаче данных, хотя бы на уровне Минцифры, решен: в ноябре Максут Шадаев заявлял, что государство по отдельным направлениям, критически важным для системы госуправления, будет просить бизнес бесплатно предоставлять обезличенные данные. Однако это неодносторонний процесс, указывал министр: бизнес получит доступ к обезличенным госданным, государственным дата-сетам, и на их основе сможет развивать свои решения.
Тогда же, в ноябре стало известно, что разработчики технологических решений в области ИИ-решений смогут получать доступ к государственным дата-сетам через государственных операторов на основе мотивированного запроса. Такая идея содержится в проекте концепции, подготовленном Минцифры и отправленном в правительство для согласования с заинтересованными ведомствами.
Предполагается, что операторы смогут не только формировать наборы данных, но и проводить обезличивание, качество которого будут подтверждать аккредитованные центры безопасности данных.
Президент Ассоциации больших данных Анна Серебряникова отмечает, что в других странах функция подтверждения правильного обезличивания данных компаниями несвойственна государству. Это обусловлено прежде всего тем, что выбор метода обезличивания зависит от конкретного дата-сета и относится к сфере компетенций и ответственности бизнеса. Целесообразный путь, по ее мнению,— риск-ориентированный подход с самостоятельной оценкой риска деобезличивания и выборочные проверки уполномоченных органов, а также введение института дата-посредников — организаций, аккредитованных государством и выполняющих функции аккумуляции лучших практик в области работы с данными.
Однако вопрос, только ли государство может подтвердить правильность обезличивания, пока не решен. До того, как станет понятна эта конструкция, преждевременно говорить о размещении данных бизнесом на единой цифровой платформе «Гостех». Госмаркет данных же может появиться в середине следующего года как приложение «Гостеха». «Мы начнем с государственных дата-сетов… а далее будем обсуждать условия и порядок размещения данных бизнеса»,— рассказывал Максут Шадаев.
Ускорение процессу должно придать поручение президента. Выступая в ноябре на конференции AI Journey 2021, Владимир Путин заявил о необходимости как можно быстрее принять законодательные решения, которые обеспечат доступ разработчиков ИИ, научных организаций, бизнеса к массиву обезличенных госданных. Он отметил, что в современных условиях любая попытка установить монополию на данные ограничивает свободную конкуренцию и экономическое развитие.
И конечно, говоря о том, в какой точке в вопросах регулирования данных мы сейчас находимся, надо указать, что в декабре этого года Минэкономики представило доработанный законопроект о Национальной системе управления данными. На ее базе будут консолидированы разрозненные данные госинформсистем и реестров. Ее единая информационная платформа — центр будущей инфраструктуры цифрового госуправления и интерфейса для доступа бизнеса и граждан к таким данным. Концепция системы была одобрена правительством еще в 2019 году и предполагала новый подход к госданным уже с 2022 года: унификацию процессов их сбора, обработки, хранения и использования. Впрочем, по мнению замдиректора Института права цифровой среды факультета права НИУ ВШЭ Михаила Якушева, документ предназначен для решения определенных бюрократических задач по управлению данными внутри госорганов и между ними. Законопроект не учитывал и продолжает не учитывать ни интересы граждан, ни интересы бизнеса, полагает он.
Решения в области данных требуют большого поиска компромиссов между интересами государства и бизнеса.
То, что в 2021 году все в этой сфере почти не вызывало больших конфликтов, скорее всего случайность — процесс не будет быстрым и легким. Впрочем, и медленным ему быть уже не судьба: скорее всего, речь идет о годе. Следующем.