Интеллект отмечен премиями
«Яндекс» в шестой раз определил победителей научной премии Yandex ML Prize
Лауреатами стали 14 человек. Их научные интересы охватывают важнейшие аспекты науки о машинном обучении и искусственном интеллекте (ИИ): понимание устройства нейросетей, когнитивную робототехнику и доверенный искусственный интеллект.
Фото: Яндекс
Кроме того, премией были отмечены и заслуги перед наукой преподавателей и научных руководителей. «Ъ-Наука» поговорил с лауреатами премии и узнал, как продвинулась наука об искусственном интеллекте и машинном обучении за прошедший год и какие ключевые достижения были отмечены премией.
Понимание работы нейросетей
Один из лауреатов премии этого года — Иван Бутаков, российский ученый и аспирант МФТИ и Сколтеха. Он внес значительный вклад в понимание работы нейросетей. Его исследования направлены на решение одного из главных вопросов в этой области: что происходит внутри ИИ, когда он обучается на данных, анализирует запрос пользователя и приходит к определенным результатам?
Нейросети до сих пор остаются для науки черным ящиком: ученые знают, как они устроены, но обработка запросов внутри нейросети все еще является загадочным процессом. А понимание этого процесса критически важно для развития и улучшения нейросетей. Исследования Ивана Бутакова показали, что обучение нейросети проходит через несколько этапов. Сначала они извлекают всю информацию из данных, а затем отбрасывают ненужное, оставляя только то, что важно для решения поставленной задачи. Этот процесс был исследован на реально используемых нейросетях, что является значительным достижением, так как ранее подобные гипотезы проверялись только на крошечных по современным меркам нейросетях.
Понимание работы нейросетей не только улучшает качество моделей, но и повышает их управляемость для человека. Так, благодаря более глубокому пониманию механизма забывания информации большими языковыми моделями у специалистов в сфере ИИ появится возможность регулировать память искусственного интеллекта и заставлять его либо лучше запоминать информацию для решения разнородных задач, либо, наоборот, забывать определенные данные. Например, случайно утекшие персональные данные или иные секретные сведения. «Иногда нам очень важно сделать так, чтобы ИИ забыл что-то,— отмечает Иван Бутаков.— С другой стороны, не менее важно бороться с так называемым катастрофическим забыванием и мотивировать нейросеть помнить ранее усвоенные сведения при обучении на различных типах задач или наборах данных».
Достижения в когнитивной робототехнике
Научная деятельность Артема Лыкова из лаборатории Intelligent Space Robotics Lab Сколтеха посвящена созданию когнитивной системы для умных автономных роботов, понимающих человеческую речь, способных ориентироваться в пространстве и планировать свою деятельность. Разработка такой когнитивной системы — один из главных вызовов для ученых и разработчиков умных роботов на сегодняшний день.
Важность умения планировать свою деятельность можно продемонстрировать на следующем примере. Представим, что вашему домашнему роботу-помощнику нужно сходить в магазин: для этого он должен спланировать, как выйти из дома, зайти в магазин, купить продукты, оплатить их на кассе и поговорить с кассиром, а затем выйти на улицу и вернуться домой. Когнитивные роботы уже существуют и обладают атомарными навыками, но такие сложные планы они пока создавать не умеют.
Фото: Яндекс
Вот пример некоторых задач, которым сумели успешно обучить робота Артем Лыков и его коллеги по лаборатории (включая еще одного выдающегося ученого — руководителя лаборатории профессора Дмитрия Тетерюкова). В работе «CognitiveDog: система на основе больших мультимодальных моделей для перевода зрения и языка в действия четвероногого робота» они представили умную роботизированную собаку, которая может не только общаться с людьми и выполнять манипуляции с физическими объектами, но и планировать свои действия для решения сложных задач. Например, она справилась с такой задачей, как принести одежду, подходящую для погоды на улице. Первым делом она подошла к окну и посмотрела в окно: оценила погоду. После этого с новыми знаниями о том, что на улице холодно, она пошла в гардероб, выбрала теплую одежду и принесла ее. Для выполнения такого типа задач робот должен уметь понимать и соотносить множество параметров из разных областей знаний.
При этом исследования Артема Лыкова могут применяться не только для наделения роботов-гуманоидов, робособак или умных манипуляторов в производстве способностью планировать свое поведение и выполнять сложные задачи, но и для создания целых роев умных роботов, управляемых на основе генеративного искусственного интеллекта, когда задание формируется не для каждого робота по отдельности, а для всего роя в целом. Такие рои смогут автономно выполнять задачи в строительстве, геологоразведке, астрофизике и других областях.
Создание доверенного искусственного интеллекта
Один из лауреатов этого года — Елена Тутубалина, руководитель научной группы Domain-specific NLP в Институте AIRI, старший научный сотрудник Института системного программирования им. В. П. Иванникова РАН и Казанского федерального университета. Она награждена за достижения в сфере научного руководства, а также за цикл работ по созданию доверенных методов искусственного интеллекта и их применению для анализа естественного языка, биомедицинских и химических данных. «Современные исследования, находящиеся на пересечении естественных наук и искусственного интеллекта, сталкиваются с рядом проблем. Основная из них — ограниченность и однотипность доступных данных»,— отмечает Елена Тутубалина. Кроме того, тексты в биомедицинской сфере отличаются сложной терминологией, множеством онтологий и неоднозначностью, что затрудняет обучение моделей. Эти факторы ведут к переобучению и смещению результатов, ограничивая обобщающую способность ИИ и снижая доверие к полученным моделям.
Ключевыми достижениями Елены Тутубалиной являются повышение эффективности и обобщающей способности языковых моделей, что способствует повышению доверия к моделям, а также создание высококачественных фундаментальных корпусов данных, обеспечивающих эффективное обучение и валидацию моделей. Проведенные исследования имеют высокую прикладную значимость и активно развиваются в проектах Исследовательского центра доверенного искусственного интеллекта (ИЦДИИ) ИСП им. В. П. Иванникова РАН, Научного центра мирового уровня «Цифровой биодизайн и персонализированное здравоохранение», а также в проектах крупных компаний. Эти работы вносят важный вклад в достижение целей, обозначенных в Национальной стратегии развития ИИ на период до 2030 года.
К числу достижений Елены Тутубалиной можно отнести и организацию научных соревнований (всего совместно с коллегами ею было организовано более десяти), а также научных конференций в области понимания естественного языка, что способствует объединению усилий российских и международных исследователей для решения фундаментальных задач в области искусственного интеллекта. Деятельность в сфере организации научных соревнований и мероприятий (конференции, лекции, симпозиумы) нередко проходит незамеченной. Однако она очень важна для обучения и обмена знаниями среди студентов и специалистов, формируя новое поколение экспертов в области искусственного интеллекта.
Вклад в обучение ML-специалистов
Машинное обучение — молодая область, которую еще десять лет назад осваивали гораздо меньше студентов, чем сейчас. И популярность этого направления росла вместе с числом соответствующих программ, объясняет лауреат премии в номинации «Преподаватели ML», доцент факультета компьютерных наук (ФКН) НИУ ВШЭ Евгений Соколов. Он преподает эту дисциплину с 2013 года. Тогда в его группе училось всего 20–30 человек, а теперь на его курс ежегодно записываются 400–500 студентов.
По словам эксперта, ML-специалистам приходится сталкиваться со сложными явлениями, некоторые из которых невозможно полностью объяснить. Например, изученный метод может не сработать на практике. Чтобы находить альтернативные решения, требуются не только технические знания, но и способность к абстрактному мышлению. Поэтому так важно развивать интуицию и учиться рассуждать. Отталкиваясь от этой идеи, Евгений Соколов не ограничивается формальным подходом к обучению, а старается показать студентам многогранность изучаемой дисциплины. Для этого он использует различные теоретические, прикладные и творческие задачи.
Помимо преподавательской деятельности, лауреат помогает широкой аудитории черпать знания по его предмету. С 2013 года он публикует в открытом доступе подробные конспекты, в которых объясняет концепции ML. По его словам, они очень популярны и многие специалисты готовятся по ним к собеседованиям. Евгений Соколов внес заметный вклад в репутацию ФКН ВШЭ как лидера в образовании по машинному обучению, и сейчас это один из главных центров экспертизы в сфере AI/ML в России.
В связи с тем, что благодаря интернету данные и обучающие материалы стали широко доступны, лауреат призывает преподавателей пересмотреть свою роль в обучении студентов. По его мнению, бессмысленно пытаться включить в программу максимум доступной информации по теме. Наоборот — задача в том, чтобы дать обзор и цельную картину своей области, а также научить критически относиться к информации, ориентироваться в разных аспектах дисциплины. Еще одна задача преподавателя, которую обозначил Евгений Соколов,— донести до студентов необходимость самостоятельно расширять знания в дальнейшем.
Автоматическое машинное обучение
Фото: Яндекс
Николай Никитин, руководитель фронтирной лаборатории в исследовательском центре «Сильный ИИ в промышленности» Университета ИТМО, занимается передовыми разработками в области автоматического машинного обучения, оптимизации и генеративного дизайна. Цели этих исследований — автоматизация создания моделей ИИ для научных и прикладных задач, их адаптация к различным целям и типам данных, а также обеспечение их универсальности и эффективности.
По словам ученого, автоматизация процессов с использованием ИИ может привести к повышению темпа разработок в наукоемких отраслях, таких как фармацевтика, биотехнология и энергетика. Разработанные методы позволяют сэкономить 30–40% времени дорогостоящих экспертов. За счет этого производительность их труда растет, а затраты компаний снижаются из-за отсутствия необходимости расширять штат специалистов.
Одним из основных достижений лауреата и его команды стало создание экосистемы методов, алгоритмов и их open-source реализаций для задач AI for science — «ИИ для науки». Она способствует повышению автоматизированности применения методов искусственного интеллекта для решения задач из разных областей науки.
Ученый делает ставку на то, что все эти методы и алгоритмы доступны в открытых репозиториях ИТМО, что позволяет ученым со всего мира использовать их в своих исследованиях. По словам Николая Никитина, это поможет другим исследователям делать свою работу эффективнее. А упрощение внедрения научных результатов в практику способствует синергии между методами искусственного интеллекта и классическими научными областями.