«В ближайшие десять лет мы окунемся в метавселенную данных»
Глава департамента анализа данных и моделирования банка ВТБ Максим Коновалихин — о том, что метавселенная ближе, чем кажется, а также о связи между концепцией Data Fusion и дополненной реальностью.
Глава департамента анализа данных и моделирования банка ВТБ Максим Коновалихин
Фото: Предоставлено пресс-службой «ВТБ»
Двадцать лет назад сбор больших данных казался прорывной практикой, а бизнес только начинал расширять свои знания о потребителе. Затем технологически продвинутые компании стали задумываться о сквозном объединении этих данных, создавая партнерства. Теперь предстоит совершить следующий шаг в сторону метавселенной данных, которая в перспективе десяти лет может объединить реальный и цифровой миры.
Исторически банки одними из первых научились извлекать ценность из статистических данных о клиентах. Первые модели кредитного скоринга, позволяющие автоматически принимать решения, датируются еще 50-ми годами прошлого века. Неудивительно, что в эпоху Big Data финансовая отрасль входит в число лидеров в задачах работы с данными. Аналитика больших данных — важный инструмент для развития клиентского сервиса, совершенствования банковских продуктов и повышения эффективности работы организации.
На сегодняшний день все успешные финансовые организации используют Big Data в работе. Во многом именно от этого зависит конкурентоспособность организации на рынке. Благодаря Big Data и алгоритмам искусственного интеллекта (ИИ) в банковской сфере произошел важный поворот от продуктоцентричного к клиентоцентричному подходу: для повышения продаж услуги должны быть ненавязчивыми и удобными.
Большие данные являются источником знаний о клиентском поведении и позволяют вычленять закономерности и предпочтения разных категорий потребителей. Именно аналитика больших данных позволяет предлагать клиентам персонифицированные продукты или выстраивать таргетированные коммуникации. В других сферах, например ритейле, большие данные обеспечивают эффективную работу рекомендательных систем, а данные о геолокации, взятые у телеком-операторов, помогают оптимизировать маршруты общественного транспорта.
Сбор персональных данных финансовыми организациями также помогает пресекать мошенничество. Например, когда пользователь со стабильным доходом и накоплениями резко снимает все деньги и пытается перевести их на другие счета, ИИ воспринимает это как подозрительную операцию и подает сигнал тревоги. Тогда банковские операции могут быть приостановлены до момента, когда клиент подтвердит свое намерение сделать перевод. К тому же большие данные — это способ банка обезопасить себя и своих клиентов от чрезмерных рисков. Например, геоаналитические модели, разрабатываемые банком на основании объединения внутренних и внешних данных о финансовой активности клиентов, позволяют компаниям более эффективно открывать точки продаж, одновременно минимизируя бизнес-риски и повышая свою доступность для потенциальных покупателей.
Банки уже научились предлагать клиентам персонифицированные продукты, подбирая их на основе клиентского поведения. Автоматические расчеты кредитного лимита, рекомендации по открытию инвестиционных вкладов и даже советы по управлению финансами. Однако в настоящий момент потенциал больших данных раскрыт не полностью. Данные всегда несут большой синергетический потенциал: ни одна из отраслей не способна создать полную картину цифровых следов своих клиентов без синергии с другими отраслями.
И здесь логично упомянуть уже достаточно распространенную концепцию Data Fusion, которая позволяет одновременно использовать не только разные и косвенно связанные массивы данных, но и применять для их обработки сразу несколько технологий. Подход Data Fusion лежит в основе многих процессов: от построения экосистем и формирования стратегии обмена данными между государством и бизнесом до ESG-повестки и создания метавселенных.
Среди направлений, в которых ВТБ применяет объединение данных прямо сейчас,— кредитный скоринг, прогнозирование рисков, разработка новых продуктов, геоаналитические сервисы для эффективного развития бизнеса и выстраивание маркетинговых коммуникаций на основе более узкого сегментирования клиентов по поведенческим группам.
Если говорить о коммуникациях, то внутренние исследования подтверждают эффективность подхода. Разработка креативов, подбор каналов и формата коммуникации в зависимости от особенностей поведения разных сегментов потребителей приводит к росту продуктивности маркетинговых кампаний.
Кроме роста эффективности работы с текущими клиентами и полной замены спама узкотаргетированными предложениями сквозное объединение позволит выйти на новые аудитории. Реализация концепции Data Fusion повышает тонкость восприятия банком потребностей и предпочтений, а значит, позволяет найти идеальный баланс в коммуникации с каждым клиентом в отдельности.
ВТБ ставит перед собой задачу по расширению взаимовыгодных партнерств и источников данных, доступных для совместного использования. Но тут мы сталкиваемся с проблемой существования монополии на данные. Существуют банковские монополии по трансакциям, данные от сотовых операторов, мы видим, что уже возникают монополии в том числе на «умные» устройства и данные от них. Коммерческие организации не торопятся обмениваться между собой данными, опасаясь конкуренции. Но множество устройств никогда не превратятся в цифровую метавселенную вокруг человека, своего рода дополненную реальность, без объединения кросс-индустриальных данных.
При этом мы видим, что с каждым днем человека окружает все больше «умных» устройств и все больше его действий оцифровывается, создавая так называемые цифровые следы. Объединив всю эту информацию, мы можем сделать жизнь человека существенно удобнее. Анализируя данные о человеке — список его покупок в интернет-магазинах, данные фитнес-трекера, его график и другую информацию, возможно формировать для него гиперперсонифицированные рекомендации, строить прогнозы. Таким образом, в ближайшие десять лет мы окунемся в метавселенную данных, где все «умные» устройства, которых мы касаемся, будут накапливать данные и помогать предсказывать наши потребности.
Чтобы это стало возможным, все данные о человеке из разных источников должны аккумулироваться в единой доверенной точке, где их можно было бы анализировать. А поскольку владельцы данных друг другу не доверяют, эта точка концентрации должна находиться на уровне каких-то облачных решений, где информация будет собираться и обрабатываться.
Технология криптоанклавов может стать той самой точкой безопасного объединения данных, метавселенной Data Fusion. Используя криптоанклавы, партнеры передают данные в криптозащищенную область. При этом доступ к их данным отсутствует у других участников анклава, для анализа этих данных применяются строго регламентированные алгоритмы, а на выходе есть возможность получить только результаты применения модели на данных участников, но не сами данные. Если упростить, то криптоанклав — это некий ящик, в который можно положить любые данные, а забрать только то, что разрешено протоколом. Например, для получения медицинского диагноза в криптоанклав можно направить результаты флюорографии. Внутри будет применен AutoML-алгоритм анализа изображения, который обратно вернет диагноз. При этом само изображение останется внутри криптоанклава в зашифрованном виде.
Технология в мире уже применяется, но пока нельзя сказать, что она вышла в большой тренд. Кроме того, самое распространенное решение принадлежит зарубежной компании и его проблематично сертифицировать и использовать в России.
О создании отечественного криптоанклава совместно с МФТИ мы задумались несколько лет назад, осознавая риски возможных санкций. В результате мы работаем над созданием специализированного программно-аппаратного комплекса, который защищен физически и программно. В него можно направить любую информацию и после отработки AutoML-алгоритма получить прогнозы, которые не несут рисков утечки исходных данных. Информация в криптоанклаве хранится в зашифрованном виде. Человек не должен иметь доступ к его данным, а задача извлечения ценности из объединенных данных полностью лежит на плечах AutoML-алгоритмов — роботов внутри криптоанклава, которые извлекают ценность для человека и отдают ее обратно в различные устройства в форме прогнозов и рекомендаций.
Возвращаясь к монополии на данные, криптоанклав дает технологическую возможность обойти такие монополии, не нарушая закона. Но нужно понимать, что для разрушения монополий кроме возможности необходимо еще регуляторное воздействие.
Опытный образец нашего криптоанклава мы планируем протестировать в начале следующего года, а также пройти необходимую сертификацию. Это позволит нам использовать технологию не только внутри банка, но и предложить ее отечественному технологическому рынку.
На первом этапе мы планируем решать задачи классификации и кластеризации в рамках наших партнерств по данным. Пока мы умеем делать очень простые вещи: оценивать риски и говорить, что нужно продавать. Далее задачи могут быть расширены, и мы рассчитываем на интерес к криптоанклаву со стороны компаний из различных отраслей. Например, сфере медицины или госорганам такая синергия данных может быть очень полезна.
Если говорить о влиянии технологии на банковскую отрасль, то изменения будут происходить скорее эволюционно. Предложения для клиентов станут более персонифицированными, рутинные функции можно будет перепоручить цифровому помощнику, который сможет пролонгировать депозиты, контролировать сбережения, предлагать инвестиционные стратегии, исходя из данных о клиенте. Качество планирования повысится, а клиент в результате просто окажется в более комфортной среде.