Открытые двери

Кооперация

Три года назад Россия подписала Хартию открытых данных на саммите G8. Страны, поддержавшие данную инициативу, пообещали не позднее чем к концу 2015 года создать технические условия для публикации открытых данных, которыми оперирует государство. Предполагается, что в этом скрыт огромный потенциал для инноваций.

Раскрытие данных госорганами — необходимый процесс для построения информационного общества

Фото: Тимофей Изотов, Коммерсантъ

Открытые данные — явление, похожее на открытое программное обеспечение (open source software). Это свободно распространяемая информация, которую может использовать любой человек или компания, без ограничений авторского права, патентов и других законодательных механизмов контроля. Чтобы соответствовать понятию Open Data полностью, данные должны быть машиночитаемыми, распространяться в том формате, в котором их может обработать компьютерная программа, в противном случае формат может стать ограничением для их использования. Главный генератор, агрегатор и поставщик открытых данных по логике вещей — государство. Считается, что чем больше людей и организаций используют открытые данные, тем больше может быть достигнуто социальных и экономических преимуществ. Данное утверждение относится как к коммерческим, так и некоммерческим областям применения. В частности, открытость данных может способствовать вовлечению обычных людей в жизнь общества и страны в целом, помогать развитию инновационной экономики и так далее.

Степан Томлянович, генеральный директор компании "ФОРС--Центр разработки" говорит, что открытые данные создают среду win-win, в которой выигрывают все участвующие стороны: граждане получают больше качественных сервисов, бизнес — перспективный рынок, государство — доверие со стороны общества и диверсификацию экономики. "И все выигрывают в качестве принятия решений, которое напрямую зависит от степени информированности",— уверен он. По его словам, по сути, открытые данные способствуют формированию информационного общества и экономики знаний. Использование их позволяет бизнесу открыть для себя новые источники роста, а представителям власти — обеспечить более качественное управление обществом, в том числе повысить уровень предоставления госуслуг, снизить риск стихийных бедствий, общественных беспорядков и пр. Для ИТ-компаний это шанс создать новые направления деятельности, связанные с разработкой приложений на основе открытых данных.

По этой причине в июне 2013 года на саммите "большой восьмерки" (G8) странами-участницами, в том числе Россией, была подписана Хартия больших данных. Государства тем самым подтвердили согласие придерживаться нескольких принципов: открытые данные по умолчанию, качество и количество, использование всеми, опубликование данных для оптимизации управления, опубликование данных для инноваций. Последнее относится к тому, что открытые данные могут быть коммерциализированы в инновационных сервисах, на их основе могут вырастать стартапы, зрелый бизнес может использовать их для своего развития и так далее. К концу 2015 года страны, подписавшие хартию, обязались технически реализовать распространение открытых данных в машиночитаемом формате. В России за это также взялись довольно основательно.

Василий Пушкин, заместитель руководителя Аналитического центра при правительстве РФ, в своем блоге на сайте Открытого правительства (open.gov.ru) рассказывает о результатах февральского заседания Совета по открытым данным. Он отмечает, что к этому моменту опубликовано более 12 тыс. наборов данных, в том числе 4,5 тыс. на федеральном портале открытых данных data.gov.ru, а количество скачиваний превысило сотни тысяч. Создано и функционирует более 150 приложений в различных сферах. Открытые данные уже сейчас создают добавленную стоимость в виде платных сервисов и оптимизации затрат.

Организация, которая занимается исследованием и популяризацией открытых данных в РФ,— АНО "Информационная культура" — выделяет 14 приоритетных направлений раскрытия данных: компании, преступность и правосудие, наблюдение за планетой (например, погода и пр.), образование, энергетика и окружающая среда, финансовые и контрактные вопросы, геопространственные данные, международное развитие, подотчетность правительственного аппарата и демократия, здравоохранение, наука и исследования, статистика, социальная мобильность и благосостояние, транспорт и инфраструктура. В исследовании, опубликованном "Инфокультурой" в нынешнем году, говорится, что по 12 направлениям данные так или иначе раскрываются. Исключение составляют наука (этот тип данных предоставляют коммерческие организации) и международное развитие.

Звон монет

Сергей Сапонов, директор по развитию бизнеса ООО "Потенциал", говорит, что принципы использования открытых данных на российском рынке отличаются от зарубежных. "Москва, как пионер в этой сфере, ориентируется не на последующую реализацию продуктов на основе данных, а на прямое потребление данных пользователем,— утверждает он.— Безусловно, на нашем рынке имеются интересные продукты на основе опубликованных данных, но их уровень монетизации либо остается достаточно непрозрачным, неочевидным, либо оставляет желать лучшего. Это связано с психологией российского пользователя, который не привык платить за контент. А создавать интересные и актуальные продукты для бесплатного потребления могут либо энтузиасты, либо профессиональные разработчики по заказу различных структур". Видимо, по этой причине на портале открытых данных data.gov.ru перечислено всего 242 готовых приложения, которые могут скачать пользователи. Это мало по сравнению с тем, сколько наборов данных доступно — 7060 по самым разным темам и регионам. В разделе "Экология" доступно 228 наборов данных, а приложений всего 2: для мониторинга чистоты воздуха в Москве ("ЭкоМониторинг") и для получения сведений о качестве водопроводной воды по районам столицы ("Вода в Москве"). В разделе "Здоровье" 320 наборов и 11 приложений, включая такие, которые подсказывают месторасположение туалетов в Воронеже, помогают записаться к врачу в Санкт-Петербурге и так далее.

Привлечь внимание стартаперов, а также вовлечь людей в активную государственную деятельность пока не особенно удалось. Например, за неделю 11-18 марта на портале, согласно собственной открытой статистике, побывало всего 1798 уникальных посетителей. Виктор Гриднев, руководитель Центра технологий управления данными компании "АйТи", говорит, что придумать, как использовать большую часть размещенных на data.gov.ru данных,— занятие достаточно сложное. "С другой стороны, и у наших западных коллег, на которых у нас принято ссылаться, большая часть размещенных данных посвящена мировому океану и погодным условиям,— говорит он.— Какую пользу несет "Перечень учреждений культуры Боровичского муниципального района" (из российского data.gov.ru) или "Анализ данных водяного столба гидролокатора" (из американского data.gov) очень непросто оценить — наверное, найдутся люди, кому это нужно и важно".

Александр Чулапов, консультант по работе с государственными организациями Teradata, рекомендует при раскрытии информации ставить себя на место потребителей этих данных. "Если открытость информации нивелируется отсутствием возможности связать данные из различных источников между собой или для этого требуются значительные усилия, то какой-либо практический смысл от подобной открытости отсутствует". По его мнению, раскрываемые данные должны содержать ключевые поля, которые бы позволяли связать различные данные между собой и сопоставить. Оптимальной была бы разработка "карты открытых данных государства", которая бы гарантировала непротиворечивость данных и отражала, каким образом данные связаны между собой.

Из других недочетов, которые сегодня наблюдаются при раскрытии данных, "Инфокультура" отмечает то, что госучреждения часто указывают условия их использования, не обозначая тип лицензии, по которой их можно потреблять. Это затрудняет работу с такими данными. Также некоторые наборы приходится скачивать кусками, а то и вовсе они могут быть недоступны для скачивания, как, например, информация о движении поездов РЖД. Некоторые сведения, перечисленные в Хартии G8, в России доступны лишь за деньги, например информация о юридических лицах (ЕГРЮЛ и ЕГРИП). "Говоря о содержательности, можно отметить, что наиболее полно относительно прочих сейчас представлены открытые данные по финансам (публикуемые Казначейством и отчасти Министерством финансов) и данные по статистике (ЕМИСС)",— говорится в аналитическом отчете "Инфокультуры".

Василий Пушкин в той же записи в блоге подтверждает, что недочеты еще имеются, и сообщает: "В текущем году государству необходимо выработать подходы к единым стандартам публикации и связывания данных, обеспечить доступ к данным через единый портал, доработать нормативно-правовую документацию, а также продолжить обучение основам работы с данными, в том числе открытыми".

В качестве хорошего примера практического использования открытых данных господин Гриднев приводит "Яндекс.Транспорт" и другие инициативы этой компании, а также проекты, связанные с путешествиями и культурой, которые разработали субъекты РФ. Успешно монетизируются проекты "Гарант" и "Консультант+", предоставляющие доступ к базе нормативно-правовых актов и сервисы на их основе. Правда, начали они это делать задолго до появления термина "открытые данные".

Александр Чулапов рассказывает о зарубежном опыте: "Среди наиболее заметных проектов по сбору данных государственными органами отмечу Австралию. Система стандартизированной бизнес-отчетности позволяет унифицировать технологию обработки и сбора данных, необходимых государству для осуществления своих функций. Открытость бизнес-глоссария и требований к форматам привлекает независимых разработчиков на рынок сбора отчетности и служит инструментом снижения затрат на информационные технологии в государственном секторе". Один из клиентов Teradata в госсекторе — Австралийская налоговая служба — получает более 60 форм отчетности в стандартном формате. Затраты на разработку систем сбора отчетности и их сложность уменьшают, освободившиеся средства перенаправляются на анализ собранной информации. Тенденция к открытости и прозрачности способствует доверию между гражданами, коммерческим сектором и государством. Господин Чулапов приводит в пример также проект, обобщающий мировой опыт,— сайт Sunlight Foundation, собирающий десятки историй использования Open Data на благо общества. В нашей стране "Инфокультура" развивает похожий проект HadofData.ru, где ведет каталог и хранит открытые данные из всех российских источников.

Андрей Свирщевский, руководитель направления углубленной аналитики "SAS Россия/СНГ", смотрит на вопрос работы с открытыми источниками данных широко. Он отмечает, что сегодня практически вся личная информация, находящаяся в открытых источниках (соцсети, посещенные сайты, поисковые запросы и т. д.), собирается и используется с самыми разными целями. Ее также можно считать разновидностью открытых данных. Их могут использовать, например, для показа более релевантной рекламы. Либо для повышения уровня безопасности. Так, в Голландии таможенная служба с помощью средств текстовой аналитики проанализировала контент форумов и обнаружила поток наркотрафика, идущего через Канаду.

Степан Томлянович рассказывает о решении, разработанном ФОРС, которое анализирует данные из социальных сетей (ForSMedia) и извлекает из открытых данных новые знания о существующих или потенциальных клиентах компании. По сути, это платформа для целевого онлайн маркетинга. В РОСЭКО был реализован проект по созданию национальной системы стоимостного анализа на базе когнитивных ситуационных центров. Частью этого проекта было создание системы для оценки недвижимости на основе данных, доступных в открытых интернет-источниках.

В целом можно считать, что основные положения Хартии G8 Россия реализовала на практике. Заложена основа для дальнейшего развития этой темы. На следующем этапе "Инфокультура" предлагает создать национальную инфраструктуру данных — платформу для катологизации, сбора и интеграции данных, что облегчит доступ к ним и поможет обеспечить связность. Возможно, после этого каталог приложений значительно пополнится, но и сейчас возможностей для создания стартапов на Open Data в России достаточно.

Светлана Рагимова

Вся лента