«Многие слышали о конфиденциальных вычислениях, но почти никто не видел»
Технический директор HFLabs Никита Назаров — о проблемах с интерпретацией термина и выборе партнеров в работе с новой технологией
Рынок конфиденциальных вычислений только формируется, но уже есть сложности с интерпретацией самого термина. Ситуацию с конфиденциальными вычислениями в России можно сравнить с лохнесским чудовищем: многие о них слышали, но никто (или почти никто) не видел. Более того, за этим термином скрываются сразу три разных понятия: протокол конфиденциальных вычислений, аппаратная платформа и федеративное обучение.
Протокол конфиденциальных вычислений — это математика и криптография в чистом виде. По сути, это метод, который позволяет нескольким участникам произвести совместные расчеты (скажем, найти средний доход клиента) без раскрытия входных данных каждого из них. Однако в разговорах о конфиденциальных вычислениях в 95% случаев речь идет не о протоколе, а об использовании технологий аппаратной защиты, например Intel SGX. В этом случае производитель предоставляет защищенную аппаратную среду, которая гарантирует безопасность загружаемых в нее данных. На практике это позволяет владельцам облачной инфраструктуры обещать своим клиентам полную защиту данных. И в этом аспекте уход с российского рынка Intel — однозначно грустный факт.
Наконец, иногда под конфиденциальными вычислениями подразумевают федеративное обучение. В общих чертах это процесс, который использует протокол конфиденциальных вычислений для обучения нейронных сетей. Естественно, что в этом случае также не происходит раскрытия данных источников. Отмечу, что ни для федеративного обучения, ни для реализации обмена с помощью протокола конфиденциальных вычислений технологии вроде Intel SGX применять необязательно.
Путаница в понятиях усугубляется еще и тем, что нередко в маркетинговых целях термином «конфиденциальные вычисления» называют то, что вообще к ним не имеет отношения. Поймать за руку в данном случае сложно, так как нужно иметь доступ не только к описанию технологии, но и к реализации конкретного алгоритма. Информация на сайтах компаний, представляющих платформы для конфиденциальных вычислений, может изобиловать математическими деталями или, напротив, быть максимально абстрактной (раз — и магия!), поэтому всем, кто хотел бы использовать эту технологию, я бы рекомендовал с максимальной тщательностью подбирать партнеров.
Что касается интереса рынка к конфиденциальным вычислениям, то в первую очередь он направлен на федеративное обучение. Крупные компании собрали огромные массивы данных о своих клиентах и теперь хотят обмениваться ими друг с другом. Информация от других игроков позволяет выбраться из собственной песочницы и, например, учитывать сведения партнеров в скоринговых моделях. При этом важно защитить клиентскую информацию так, чтобы избежать утечки данных и не нарушить закон. И если посмотреть на конфиденциальные вычисления с этой точки зрения, то они, безусловно, перспективны, так как сама технология обеспечивает безопасность обмена.
Другое дело, что штрафы за утечки персональных данных в последнее время не превышают 60 тыс. руб., тем не менее наметился отчетливый тренд по ужесточению ответственности в таких ситуация — Минцифры уже разрабатывает законопроект, по которому наказание может составлять до 1–3% от оборота. На этом фоне конфиденциальные вычисления, несмотря на сложность в плане организации процесса и более длительное, чем при классических методах, обучение скоринговых моделей, становятся все более актуальными.