Правительство поручило Минцифры к февралю разработать план по предоставлению бизнесу доступа к государственным обезличенным данным для обучения искусственного интеллекта (ИИ). На первом этапе откроют информацию Россельхознадзора, ФНС, Росстата, Минвостокразвития и Росреестра. Это позволит бизнесу быстрее выводить на рынок релевантные продукты, но в обмен компаниям придется подключиться к оказанию госуслуг, считают эксперты.
Фото: Юрий Мартьянов, Коммерсантъ
“Ъ” ознакомился с перечнем поручений правительства по итогам совещания с руководителями цифровой трансформации министерств и ведомств, которое состоялось 29 декабря. Согласно документу, вице-премьер Дмитрий Чернышенко поручил главе Минцифры Максуту Шадаеву до 1 февраля представить согласованный план-график обеспечения доступа бизнеса к дата-сетам министерств и ведомств. Документ был опубликован в Telegram-канале «Майский указ».
В пресс-службе господина Чернышенко “Ъ” подтвердили поручение: «Прорабатываются изменения в законодательство для предоставления разработчикам ИИ-решений доступа к государственным наборам данных, урегулирования вопросов обезличивания».
В Минцифры “Ъ” уточнили, что в план-график вошли мероприятия по проведению стратегических сессий, разработке стандартов для отраслевых решений с применением ИИ, публикации результатов внедрения ИИ в ФОИВах, а также созданию единого хранилища (репозитория) наборов данных и регламентов работы с ними. «Проект плана-графика проходит процедуру согласования с ведомствами»,— пояснили в министерстве.
Под дата-сетами понимают набор данных, размеченных так, чтобы их считывали нейронные сети. В планы ведомств также должно войти тестирование дата-сетов на хакатонах по ИИ, следует из перечня поручений правительства. По данным Минцифры, в 2021 году сформировано 26 ведомственных дата-сетов: 4 (Россельхознадзор, ФНС России, Росстат, Минвостокразвития, Росреестр) — с возможностью использования сторонними разработчиками для бизнес-решений и 22 — для внутренних нужд ФОИВов в рамках цифровой трансформации.
В конце 2021 года Максут Шадаев говорил, что создание единого государственного data lake (озеро данных) и запуск маркетплейса дата-сетов станут приоритетными направлениями работы министерства в 2022 году (см. “Ъ” от 30 декабря 2021 года). Data lake позволит в том числе собирать обезличенные данные в регионах и на их основе проводить расширенную аналитику, пояснял министр. Такие данные должны стать основой развития технологии ИИ. Однако законопроект о порядке обезличивания персональных данных, внесенный в Госдуму еще летом 2020 года, до сих пор не принят.
45 миллиардов рублей
составил рынок больших данных в России в 2019 году, по оценке Boston Consulting Group.
Дата-сеты, которые аккумулировало государство в ходе многолетнего цифрового взаимодействия с гражданами и юрлицами,— источник бесконечной информации для бизнеса, отмечает директор центра стратегического развития «Ланит-Интеграции» Павел Сварник. «Они позволят скорректировать тарифы по услугам, запустить востребованные сервисы, точнее спрогнозировать параметры инвестиционных проектов»,— говорит он. В обмен бизнес может взять на себя часть нагрузки по оказанию государственных услуг, предполагает эксперт. По его мнению, появятся новые операторы коммерческих услуг, которые будут «заодно выполнять государственные задачи». Без этого, уверен Павел Сварник, государство не сможет создать так называемые суперсервисы (наборы госуслуг, ориентированные на типовые жизненные ситуации граждан и бизнеса).
Государственные организации всегда отличались консервативностью в отношении информации, поэтому источников для разработки цифровых решений у бизнеса иногда просто нет, отмечает директор по решениям импортозамещения КРОК Наталия Софронова. «Единая фабрика данных упростит задачу, сокращая время обучения ИИ и вывода продукта на рынок»,— говорит она. Ключевым вопросом, который придется решить, по ее мнению, будет безопасность предоставления такой информации.