АI — это технология для человека
На наши вопросы о синергии искусственного интеллекта и научных исследований, «Научном облаке» и новом сезоне Научной премии Сбера отвечает Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка.
— Андрей Андреевич, на Петербургском международном экономическом форуме в июне Сбер анонсировал создание национальной платформы научных моделей «Научное облако». Что это такое и почему важно?
— «Научное облако» — это новое понятие. Мы с коллегами из Санкт-Петербурга понимаем, что современные научные исследования все чаще содержат математические модели. В любом случае они всегда включают экспериментальные данные. Очень важно, чтобы полученные одной командой результаты были доступны другим исследователям. Поэтому научные работы надо публиковать. Но эта область у нас в стране остается недостаточно охваченной и развитой.
Проект «Научное облако» призван упростить для ученых доступ к передовым облачным технологиям, моделям машинного обучения, практикам их применения и быстрее обмениваться результатами, использовать наработки друг друга, проверять их или использовать для достижения лучших результатов. Мы считаем, что это заметно ускорит научные исследования в стране, поможет ученым двигаться быстрее.
— Как вы сегодня видите применение искусственного интеллекта (AI) в науке, в конкретных ее областях?
— Это очень интересное направление, и особенно динамично оно развивается вместе с появлением генеративного AI. С использованием этих моделей можно сэкономить большое количество времени и усилий, которые тратятся нашими учеными и исследователями. Проблема в том, что человек не может обрабатывать нынешний поток информации — невозможно все прочитать и сделать выводы. Модели генеративного AI позволяют ученым очень быстро суммаризировать то, что содержится в статьях по профильным тематикам, извлекать факты, делать выводы или даже «поговорить» с документом, понять, какие основные факторы могут быть важны для работы, которой занимается научный коллектив. Другая история — постановка, документирование, описание эксперимента. Генеративные модели очень хорошо с этим справляются. Следующая задача связана с тем, что многие области индустрии развиваются за счет создания собственных фундаментальных AI моделей (например, в химии или фармацевтике при разработке лекарств). Фундаментальная модель в какой-то конкретной области может использоваться, чтобы проводить определенные эксперименты, искать новые материалы и вещества, предсказывать их свойства. То, что нас очень сильно мотивирует и интересует,— это использование мультиагентных систем, которые могут брать на себя задачи сотрудников лаборатории. Нам кажется, что в этом есть большой научной потенциал.
— Можно ли сказать, что AI сегодня — это ваше приоритетное исследовательское направление?
— Можно сказать, что мы активно занимаемся исследованиями в области AI — это для нас важное направление научной работы, которым занимается большой коллектив сотрудников. Мы сформулировали для себя концепцию, которую называем «практичный сильный AI». Для нас она определяет ключевые направления исследований, двигаясь по которым на каждом шаге мы можем улучшать качество наших моделей, их взаимодействия между собой.
— Каким образом вы их используете?
— Наш фокус внимания — это фундаментальные генеративные модели. Наверное, все знают нашу модель GigaChat, ею воспользовалось уже больше 6 млн человек — это большая аудитория. Используют ее самым разным образом: для помощи в поиске и анализе информации, в обработке больших объемов данных и текстов, в помощи решения креативных задач, когда нужен собеседник, способный дать хорошие идеи. В структурировании деятельности, в подготовке предварительного анализа и обработке документов, в подготовке ответов. Каждый человек находит себе разные сценарии, но для тех, кто к этому привык, это становится ежедневным инструментом.
Есть и другие модели, которые на сегодняшний день стали привычными в креативном поле. Например, еще одна наша нейросеть — Kandinsky,— с помощью которой можно генерировать картинки и создавать видеоролики. Появился новый подход: когда ты хочешь что-то проиллюстрировать, то не нужно больше искать картинку в интернете. А можно просто объяснить модели, что именно хочешь увидеть, и гораздо быстрее и с лучшим качеством получить ответ на свой вопрос.
— Вы сами так делаете?
— Я делаю так постоянно. Мой регулярный сценарий — когда надо поздравить человека, я делаю для него открытку, учитывая его интересы. Найти изображение, которое будет точно совпадать с тем, что я хотел бы выразить, значительно сложнее и дольше, а иногда просто невозможно.
— Не уходит ли какая-то душевность из такого поздравления?
— Для меня это, наоборот, выразительное средство. Я не умею рисовать и не могу сделать такой подарок другу. Я не очень умею пользоваться современными фоторедакторами, а если попробую создать коллаж, у меня получится что-то аляповатое. Тексты я пишу сам, но не умею сочинять стихи, а иногда хочется что-то зарифмовать. Работа с моделью — это тоже творческий процесс, просто в нем появляются другие выразительные инструменты, которые можно использовать. Вот мне всегда это интересно. Ни у одного из моих знакомых не было ощущения, что о нем не подумали или прислали что-то стандартное, ведь это сделано специально для него.
Если говорить о других направлениях исследований, то важно отметить, что происходит на стыке классической фундаментальной науки и генеративного AI. Мы работаем над направлением, связанным с химией, материаловедением, исследуем возможности применения генеративной модели в конструкторской деятельности, в дизайне. Еще одна интересная сфера — исследование восприятий человека во взаимодействии с AI. Для нас это тема непростая. Может быть, мы оказываемся в плену самого понятия «искусственный интеллект», который иногда одушевляем, вкладываем что-то свое. Кто-то — что-то доброе, кто-то — что-то страшное. И тут встает вопрос о восприятии человека, вопрос, как на эмоциональном уровне показать, что на самом деле эта технология за человека и для человека.
— Сбер — один из крупнейших участников программы развития исследовательских центров искусственного интеллекта. Для чего они созданы, как работают?
— У нас достаточно успешный опыт сотрудничества с ними, мы поддерживаем 8 из 12 центров, созданных в Высшей школе экономики, Сколтехе, МФТИ, ИТМО и других университетах и научных центрах. Для нас это возможность усилить исследовательские команды, потому что все-таки эти Центры — это ведущие академические вузы и исследовательские институты, в которых работают специалисты в самых различных областях науки. Порядка 600 человек из этих центров вовлечены в наши проекты, это мощнейшая сила. Так, с точки зрения бизнес-результата мы, например, оцениваем, что от такого сотрудничества финансовый эффект для Сбера уже составил больше миллиарда рублей. Это крайне эффективная модель. Заодно мы обеспечиваем технологический трансфер, предоставляем наши фундаментальные модели этим исследовательским командам и очень рассчитываем на то, что они их используют в своей работе.
— Какие результаты научно-исследовательской деятельности Сбера за прошлый год вы считаете наиболее важными, актуальными, интересными?
— Если говорить про статистические показатели, то мы опубликовали более 250 статей в журналах высокого уровня. А за первую половину 2024 года мы эти показатели уже превзошли, ускорились вдвое, но для нас важна не сама по себе публикационная активность, а подтверждение того, что результаты принимаются и оценивается научным сообществом. В этом году наши ученые совместно с коллегами из Сколтеха разработали AI-модели, предназначенные для прогнозирования засух по климатическим данным на период от нескольких месяцев до года. Модели учитывают глобальное потепление и другие факторы, что позволяет строить качественные прогнозы, которые будут помогать бизнесу адаптироваться к изменяющимся климатическим условиям. Также недавно вышла публикация нашего научного партнера Института AIRI, в которой объясняется, как можно для определенного типа моделей машинного обучения создавать цифровые водяные знаки. Одна из проблем на рынке — когда интеллектуальная собственность, которую вложили в модель, утекает путем тех или иных способов копирования. В работе представлены возможные математические алгоритмы, подходы, которые позволят бороться с такого рода плагиатом. Разработчики, создающие модели, особенно фундаментальные, должны иметь возможности управлять своей интеллектуальной собственностью — какие модели и в каком качестве они разрешают использовать, какие делают открытыми, какие будут права на копирование и распространение этих моделей. Нам важно, чтобы это был цивилизованный рынок.
— Мы говорим о тех преимуществах, которые дает применение AI в науке и технологиях. Какие тут могут быть проблемы и вызовы?
— Одна из важнейших областей, которой мы занимаемся постоянно с наших первых моделей,— это этика применения AI. Чтобы сформулировать принципы, что такое хорошо и что такое плохо, в России был разработан Кодекс этики в сфере искусственного интеллекта. Мы были одним из разработчиков этого документа, в числе первых его подписывали. Развивается он на базе Альянса в сфере AI. Так как искусственный интеллект все глубже проникает во все сферы жизни, то, мне кажется, каждый человек должен знать, что компания, продукты и услуги которой он использует, разделяет этические принципы и применяет их в своей работе. Кодекс открытый, всем рекомендую его посмотреть и начинать интересоваться: та компания, с которой вы взаимодействуете, поддерживает эти принципы или нет.
— Значит, есть компании, которые этот кодекс почему-то не поддерживают?
— Есть компании, которые еще не присоединялись. Может быть, они придерживаются таких же принципов в своей работе, мы не знаем. Безусловно, я рассчитываю, что все, кто работает с технологиями AI, задумаются об этом и присоединятся к Кодексу этики. Мне кажется, что это очень важный инструмент.
— Какие вы видите перспективы применения AI в науке? Ждать ли нам революции в ближайшие пять-десять лет?
— Я думаю, ситуация будет развиваться быстро, и в течение трех-пяти лет в науке благодаря AI изменится многое: ученый получит полноценного ассистента, в десятки раз увеличится скорость исследований, а многие эксперименты будут выполняться полностью автоматически, без участия человека. Вот последний пример: один из мировых лидеров в этой сфере OpenAI на днях выпустила семейство моделей o1. Главное их отличие от предыдущих — они могут рассуждать, а потом сообщают свое суждение, то есть могут эффективно проверять факты, «размышлять» при решении сложных проблем. В компании утверждают, что особенно хорошо новые модели справляются с задачами, связанными с математикой и программированием. Такие способности могут пригодиться прежде всего в математике, теории информации и других областях, связанных с формальной логикой.
— В этом году стартовал третий сезон Научной премии Сбера и появилась новая номинация, посвященная AI. Зачем она нужна?
— Тут две вещи: действительно, наука двигает вперед и бизнес, и общество, и человека, и экономику. И мы считаем, что, как крупная корпорация, должны вносить свой вклад. Научная премия — это возможность отметить ученых, которые всю жизнь положили на развитие науки, имеют неоспоримые научные результаты и еще многого добьются. Мы внимательно относимся к тому, чтобы критерии отбора были абсолютно независимы, потому что именно это является залогом ценности премии. И надеемся, что каждый наш лауреат станет амбассадором премии.
А еще с этого года у нас появилась категория для молодых ученых — это наше будущее, наша самая главная надежда. Мы решили отметить их отдельно новой номинацией «AI в науке», потому что у их более старших коллег есть фора — они дольше занимались наукой, у них было больше времени для достижения результатов. У нас уже получен список из очень сильных номинантов, и мне кажется, что жюри будет сложно делать выбор.