По оценке операторов связи, объем данных, подлежащих хранению по «закону Яровой», достигает 157,5 эксабайта. Каковы риски создания хранилищ данных и готовность отечественной софтверной отрасли к их обслуживанию, в интервью “Ъ” рассказала гендиректор InfoWatch Наталья Касперская.
— Какие технологические сложности будут испытывать операторы связи и интернет-компании в связи с тем, что им придется хранить и обрабатывать огромные объемы данных для реализации нормативных требований?
— Мне не очень понятна необходимость хранения одних и тех же данных разными операторами. Дело даже не в том, что это дорого и сложно, а в том, что обрабатывать их гораздо сложнее, потому что мы будем иметь сразу несколько мест хранения и, очевидно, это будут дублирующиеся данные. Если, например, абонент одного оператора напишет сообщение абоненту другого оператора, то эту переписку придется хранить обеим компаниям. Таким образом, потребуется гораздо больше резервов хранилищ, чем если бы это было единое хранилище данных.
Вторая проблема состоит в том, что использование этих данных, например поиск по хранилищу, будет значительно затруднен. Если будет условно 15–20 хранилищ и по ним придется осуществлять сквозной поиск или вести аналитику, то, кто тогда будет заниматься этой задачей, пока неясно. С технической точки зрения правильнее сделать единую архитектуру, единое хранилище, в котором возможно осуществлять поиск и применять средства автоматизации. Тогда использовать собранные данные будет возможно по любому назначению.
— Кто, на ваш взгляд, мог бы стать оператором единого хранилища?
— Это должны решать государственные органы.
— Действительно ли на рынке сейчас нет технических и программных средств для реализации требований по сбору и хранению трафика?
— Если мы предположим, что это будет единое хранилище, то с точки зрения обеспечения информационной безопасности такие средства, конечно, есть. Если же будет множество разнообразных хранилищ, сложность задачи возрастает на порядок и реализация технических и программных средств становится более сложной.
У нас есть, конечно, отечественные средства обработки Big Data, поисковые машины. Извлечение и анализ информации из разных типов данных тоже возможен, есть большое количество команд, которые развивают подобные решения. Я не думаю, что потребуется специально разрабатывать какие-то новые средства и софт. Конечно, могут потребоваться доработки под конкретные требования, но выполнить их будет гораздо проще, чем разработать программный продукт с нуля. Разработки полного набора программных решений с нуля на государственные средства точно не потребуется.
— Какими могут быть источники финансирования в случае необходимости создания технических средств? Заказы самих операторов или софинансирование государством?
— Необходимость софинансирования — это вопрос к государственным органам, но надо сказать, что сумма, которая потребуется на доработку необходимой технической базы, будет сильно разниться в зависимости от того, какой вариант хранилища предложат отрасли. На мой взгляд, вариант единого хранилища будет суммарно значительно дешевле, чем перекладывание задачи на плечи каждого оператора.
— Недавно вы возглавили комитет по информационной безопасности ассоциации «Отечественный софт». Есть ли среди задач вопрос разработки софта для хранения и защиты данных по «закону Яровой»?
— Если встанет такой вопрос, вполне возможно, что мы рассмотрим это направление. Но пока такой задачи не сформулировано. Мы сфокусированы на вопросах информационной безопасности.