Вопрос проб и ошибок
Искусственный интеллект должен обладать способностью решать различные задачи одновременно
О том, зачем и как изучать искусственный интеллект, «Ъ-Наука» побеседовал с Иваном Оселедецем, доктором физико-математических наук, профессором РАН, СЕО Института искусственного интеллекта AIRI, профессором Сколтеха.
Доктор физико-математических наук, профессор РАН, СЕО Института искусственного интеллекта AIRI, профессор Сколтеха Иван Оселедец
Фото: Институт искусственного интеллекта AIRI
— Что такое искусственный интеллект? Как вы для себя определяете это понятие?
— Для меня искусственный интеллект — это технология, позволяющая компьютерам выполнять задачи, которые раньше могли выполнять только люди, такие «интеллектуальные компьютерные программы». Даже калькулятор в таком смысле очень «узкий», но ИИ, так как позволяет умножать числа с такой скоростью, с которой человек не способен. И все же сейчас речь идет о существенно более сложных задачах. Например, распознавание лиц или общение с клиентами в чат-ботах. При этом использование искусственного интеллекта позволяет существенно улучшить эффективность и производительность бизнеса практически во всех сферах.
— На данный момент специалисты в области компьютерных систем выделяют три основных вида искусственного интеллекта: ограниченный или слабый (Narrow artificial intelligence), сильный (Artificial general intelligence) и суперискусственный интеллект (Super artificial intelligence). Расскажите подробнее о каждом из них.
— Любая классификация в большей степени условна, и сколько специалистов, столько и мнений. Например, некоторые исследователи относят к суперискусственному интеллекту систему для прогнозирования структур белков Alphafold, но с этим можно поспорить, так как у людей это вообще никогда не получалось.
Если говорить о сильном и слабом ИИ, то грань видна достаточно четко. Слабый ИИ нацелен на решение одной, может быть, очень важной, но конкретной задачи, а сильный ИИ должен обладать способностью решать различные задачи одновременно, работать с разными данными, уметь слышать, видеть, говорить, понимать, в общем, быть похожим на человека во многих сферах. С появлением ChatGPT год назад мы существенно приблизились к созданию сильного ИИ.
— Где сейчас применяется ИИ?
—Искусственный интеллект успешно применяют во многих областях, в еще большем количестве областей его пытаются применять.
Например, одной из наиболее успешных областей применения ИИ в России является медицина. ИИ-помощники врача анализируют огромное количество медицинских снимков и историй болезней и уже сейчас ставят диагнозы на уровне врачей, помогают им не пропустить какие-то сложные ситуации. Известен случай, когда ИИ помог врачу-рентгенологу не пропустить инсульт. Человек был спасен.
Применение ИИ в ИТ-индустрии связано с эффективным поиском, рекламой, рекомендациями товаров и музыки. Это существенная часть прибыли. В банковской сфере ИИ незаменим при выдаче кредитов. Например, прибыль от внедрения искусственного интеллекта за последние три года «Сбер» оценивает в 800 млрд руб.
Среди других применений можно назвать нефтеразведку и нефтедобычу, где применение ИИ-технологий сокращает издержки, транспортную логистику. В промышленном производстве потенциал ИИ также огромен, но его создание и внедрение пока идут достаточно тяжело.
На мой взгляд, именно в реальном секторе экономики лежит основной потенциал применения искусственного интеллекта, который еще только предстоит раскрыть.
— В чем отличие ИИ от нейросетей?
— Нейросети — это один из видов искусственного интеллекта, который получил наибольшую популярность после 2012 года. Тогда ими научились нормально пользоваться.
Внутри нейросетей лежит идея композиции простых вычислительных блоков, которые объединяются для решения какой-то одной задачи в процессе обучения ИИ. В частности, именно алгоритм, основанный на глубоких нейросетях (deep neural networks), смог впервые превзойти человека в задачах распознавания объектов на изображениях.
Сейчас 99% всех подходов ИИ используют разные нейросетевые архитектуры. В основном сверточные сети и трансформеры. Трансформеры стали основой для больших языковых моделей и того же ChatGPT.
— Расскажите о мультимодальных и генеративных ИИ-моделях.
— Генеративные модели способны создавать в первую очередь текст и изображения по текстовому запросу. 2023 год можно смело назвать годом генеративного искусственного интеллекта.
Существует множество генеративных моделей: GPT-4, GigaСhat, Kandinsky, Falcon, Mistral, LLava… Их количество измеряется десятками. Принцип работы таких моделей примерно одинаков: модели показывают огромное количество примеров, скажем, картинок, а она понимает, что это такое, и учится создавать новые образы. Это может попробовать каждый, и такие модели уже активно используются в креативных индустриях, создании контента, дизайне, искусстве.
Сейчас это картинки и текст, но ключевое слово моделей следующего поколения –– мультимодальность. Модель должна быть способна понимать данные разных типов. Понимать, что нарисовано на изображении, и отвечать на вопросы. Например, мультимодальная медицинская модель должна иметь возможность по рентгену дать примерный диагноз или проанализировать фото холодильника, составив список находящихся в нем продуктов и предложив рецепт. Такая функциональность уже доступна как в зарубежных (GPT-4V, LLava) моделях, так и в наших (OmniFusion).
По моему мнению, в ближайшее время число модальностей будет расти: к ним уже добавляются видео и звук.
— Какая наука изучает искусственный интеллект?
—Искусственный интеллект –– междисциплинарная область, которая уже стала своей областью науки: существуют конференции по ИИ, образовательные программы, научные центры.
В AIRI работают более 100 ученых, среди которых есть математики, биологи, физики, инженеры и филологи, но все они работают над разными аспектами ИИ. Размытость границ различных областей знаний характерна для всей науки. Я недавно пытался понять разницу между физической химией и химической физикой, но, несмотря на то что являюсь доктором физико-математических наук и выпускником физтеха, четко понять не смог.
Сейчас вся наука становится междисциплинарной, границы между областями стираются. Мне ближе всего математика. Но это только мое личное мнение.
— Существуют два основных подхода к исследованию ИИ — нейрокибернетика и кибернетика черного ящика. Расскажите подробнее о каждом из них.
— Повторюсь, что сколько человек, столько и мнений. На мой взгляд, слово «кибернетика» здесь неуместно, обычно оно специалистами не используется. На данный момент мы плохо понимаем, как работает ИИ, но все-таки делаем это гораздо лучше, чем мы понимаем работу человеческого мозга через призму нейронаук. Хоть искусственные нейросети и возникли по аналогии с нейронами головного мозга, эта аналогия довольно условна. Есть ряд проектов, которые изучают нейросети так, как изучают человеческий мозг. Пока они носят довольно частный характер ввиду огромной сложности темы, но есть даже ряд успешных результатов, в том числе в России, в группе К. В. Анохина.
Все хотят понимания принципов работы. Сейчас инженеры и математики сделали ИИ, который работает здорово, но не очень понятно почему. Построение связной теории этого черного ящика –– сложнейшая задача, которая, возможно, потребует создания новой математики. Примером такой математики стала знаменитая аксиоматика Колмогорова, который перевел статистику в строго формализованную теорию вероятностей. Очень надеюсь, что такое произойдет и с ИИ.
— Как ИИ помогает в исследованиях фундаментальной науки?
— На данный момент ИИ используется для ускорения и автоматизации рутинной работы. Недавняя статья от DeepMind (где один из авторов — мой бывший аспирант Александр Новиков) под названием «FunSearch» помогла решить одну из классических математических работ путем «умного перебора».
Некоторые из моих коллег используют ChatGPT для ускорения доказательства теорем, так как многие части таких доказательств являются на самом деле рутиной. Вспомните стандартные решения школьных задач по математике: как делать — понятно, но каждый шаг надо сделать правильно, иначе ответ будет ошибочный и вы получите двойку.
В фундаментальной науке роль ИИ (в первую очередь больших языковых моделей) такая же, как и в других областях: усиление возможностей человека, сокращение времени, которое мы тратим на рутину.
— В 2016 году ученый Хироаки Китано предположил, что искусственный интеллект сможет преодолеть ряд человеческих когнитивных ограничений, мешающих ускорить процесс достижения научных открытий. Как вы думаете, каков потенциал или, наоборот, принципиальные ограничения использования ИИ в естественных и точных науках?
— У искусственного интеллекта есть потенциал в естественных и точных науках. Например, в математике он может использоваться для поиска доказательств теорем, а в физике — для решения сложных уравнений. ИИ уже активно используется в экспериментальной физике. В частности, в физике высоких энергий были применены многие современные методы машинного обучения.
Все это вопрос проб и ошибок и, что самое главное, вопрос построения правильных критериев оценки качества работы ИИ. Мы их называем бенчмарками. Если в сфере можно такие критерии сформулировать, то в ней можно попробовать применить методы искусственного интеллекта. Естественно, сперва без каких-либо гарантий.
Главное ограничение настоящего –– отсутствие больших и реалистичных наборов данных и, если быть честным, экономической целесообразности.