Два подхода в одном фреймворке
Российские исследователи повысили точность рекомендательных систем
Ученые Института искусственного интеллекта AIRI разработали фреймворк, который объединил два популярных подхода, используемых сегодня повсеместно в рекомендательных системах. Научное открытие было представлено в ходе конференции ACM Web Conference в Сингапуре. Евгений Фролов, PhD, руководитель группы «Технологии персонализации» Института AIRI, рассказал «Ъ-Науке», что такое фреймворк и как новый подход может помочь в медицине.
Руководитель группы «Технологии персонализации» Института AIRI, PhD Евгений Фролов
— Что такое фреймворк?
— С точки зрения научного подхода фреймворк — это структура решения, определяющая правила взаимодействия различных компонентов для получения ожидаемых результатов. В данном случае фреймворк синонимичен парадигме, общему подходу. Однако важно понимать, что фреймворк — это не просто видение, а конкретные правила реализации взаимодействия компонентов для достижения заданного результата.
— Как работает система рекомендаций?
— В промышленности и на производстве под рекомендательными системами обычно понимают системы поддержки принятия решений. В них заложены либо логические правила, либо физические модели процессов и устройств, которые позволяют вывести ответы на конкретные действия или запросы. Эти системы четко формулируют, например, как и какой тумблер нужно подкрутить, чтобы повысить производительность на линии на 5%. Это не те рекомендательные системы, о которых мы будем говорить ниже.
В более общеупотребимом значении рекомендательные системы — это модели, анализирующие поведение пользователей, чаще всего потребителей, чтобы выявить закономерности и на их основе предсказать интересы. Классический пример: пользователь посмотрел несколько фильмов, и система должна определить, какой следующий фильм может ему понравиться. Задача состоит в том, чтобы понять его интересы и порекомендовать то, что будет релевантно.
Сам механизм принятия решений остается скрытым — подходы строятся на основе математических моделей. Несмотря на то что они не пытаются воссоздать реальные процессы в мозге человека, модели прекрасно работают благодаря коллаборативному анализу большого числа людей и их коллективного поведения. Когда данных по коллективному поведению достаточно много, математические модели рекомендательных систем приобретают предсказательную силу. Переходя от анализа коллективного поведения к индивидуальному, система начинает давать рекомендации уже на личном уровне, предлагая то, что может заинтересовать человека, исходя из его собственной истории.
— Расскажите подробнее о том, как применяются алгоритмы рекомендательных систем в здравоохранении.
— Алгоритмы рекомендательных систем могут применяться для выбора наиболее эффективных лекарств. Разные пациенты имеют индивидуальные истории болезней, связанные с целым набором лекарств, которые могут быть им полезны. Рекомендательная система может собрать истории болезни различных пациентов, историю выписанных лекарств и информацию о результатах лечения: удалось ли вылечить пациента, за какой срок, потребовались ли дополнительные вмешательства и т. д.
В простейшем случае создается матрица, то есть таблица чисел, где строки представляют пациентов, а столбцы — лекарства или их компоненты, которые нужно проверить. Элементами матрицы может быть просто сигнал: лекарство эффективно или нет. Подобно тому, как мы рекомендуем фильмы, которые могут понравиться пользователям, мы можем рекомендовать конкретные лекарства пациентам на основе собранных данных.
Вариантов индивидуальных непереносимостей и факторов, влияющих на эффективность лекарства, очень много, и учесть все их взаимодействия сложно. Для этого нужна сложная модель. Пока что такой возможности нет, но мы можем собрать множество данных и анализировать конкретные примеры для разных пациентов. На истории одного человека нельзя изучить все лекарства, но при сборе данных по большому количеству пациентов можно выявить паттерны и особенности взаимодействия лекарственных компонентов.
Дополнительная информация, такая как пол, вес, рост пациента, а также состав и концентрация веществ в лекарствах, тоже может оказаться полезной. В целом подход не меняется: мы используем большие объемы данных и рекомендательные системы для выявления скрытых закономерностей.
В Сколтехе проводились исследования по выбору белковых компонентов для борьбы с вирусами: был взят набор вирусов и белковых компонентов, а также данные об их взаимодействии. Задача состояла в том, чтобы дополнить эту информацию и построить предсказательную модель, которая на основе имеющихся данных предскажет эффективность компонентов против новых вирусов — например, того же класса или семейства.
Рекомендательные системы могут применяться и в более широких задачах — например, при построении оптимальных траекторий для здорового образа жизни. Подобно созданию оптимального плейлиста, система может предлагать индивидуальную траекторию питания и соотношение БЖУ на основе данных о диетах других людей с учетом их особенностей.
Разработкой рекомендательных систем занимаются целые группы в академическом сообществе. Есть лаборатории, которые адаптируют механизмы рекомендательных систем для задач построения рекомендаций по здоровому питанию и образу жизни, учитывая не только состав диеты, но и физические нагрузки, сон и другие факторы.
— Какие возможности дает объединение двух подходов использования рекомендательных систем в единый фреймворк?
— В нашей работе был предложен фреймворк, который универсально обобщает локальные знания о взаимодействиях и глобальное знание о большой структуре этих взаимодействий. Этот фреймворк, хоть и применен в специфическом сценарии, не для медицинских исследований, в целом универсален.
В нашем исследовании локальные данные были представленными упорядоченными историями потребления каждого пользователя. Алгоритмы на основе последовательного обучения при формировании рекомендаций используют информацию не только о выбранных пользователями продуктах, но и о порядке их потребления. В свою очередь, графовый подход позволяет учитывать дальние связи между товарами, с которыми пользователь напрямую не взаимодействовал. В этом случае предсказания генерируются на основе выбора других пользователей, которые ранее взаимодействовали с теми же товарами, что определяет глобальную картину взаимодействий.
Объединение двух различных подходов в единый фреймворк позволяет получить более точные предсказания. Каждая составляющая обладает собственным знанием и предсказательной силой, а при их объединении они компенсируют недостатки друг друга и в совокупности дают положительный эффект на качество предсказаний.
— Где этот фреймворк можно будет применять на практике?
— Новый подход будет полезен исследователям машинного обучения во множестве различных областей: от медицины до индустрии развлечений. В первую очередь это именно сервисы рекомендательных систем независимо от конкретного домена их применения — книги, музыка, товары или что-то еще. Важную роль в таких сервисах играет обогащение и обобщение знания о потребительском поведении, но наш фреймворк мог бы внести вклад и в интеграцию решений, использующих большие языковые модели.
Сегодня в области рекомендательных систем появилась возможность значительного прогресса благодаря объединению этих систем с моделями знания о мире. Самым явным примером таких моделей сейчас являются языковые модели — например, ChatGPT. Эти модели могут общаться с человеком на произвольные темы и предоставлять знания о мире на естественном языке. Сейчас их пытаются адаптировать для рекомендательных систем, потому что они действительно могут обладать узкоспециализированными знаниями. Эти модели обучены на больших корпусах медицинских текстов и понимают особенности диагностики и специальные случаи.
В интернете можно найти примеры, когда языковая модель помогла идентифицировать правильный диагноз и схему лечения для конкретного пациента. Однако такие случаи редки, поскольку языковые модели глобальны и не обладают достаточным уровнем персонализации, чтобы учесть все особенности каждого пациента. Они не обучены учитывать коллективное поведение и взаимосвязи в нем. Рекомендательные системы изначально предназначены для анализа таких связей, и они хорошо понимают мир, собирая структурированные знания внутри.
Вопрос о том, как объединить рекомендательные системы и языковые модели, остается открытым. Разрабатывается множество подходов, но универсального решения, которое объединяло бы мощь языковых моделей и рекомендательных систем, пока не найдено. Это направление перспективное, и существует много попыток решить эту задачу.
Парадигма, которую мы предлагаем, может частично ответить на этот вызов. Детали могут отличаться, и, возможно, потребуется адаптация. Однако это направление очень интересное. Идея дополнения моделей возникла у нас на конференции, где мы представляли нашу работу. Параллельный доклад о локальном и глобальном знании заставил нас задуматься о возможности адаптировать наш подход для объединения языковой модели, знающей обо всем, с рекомендательной моделью, которая знает о каждом, но очень специфична.
Языковые модели могут быть обучены на конкретных доменах, включая медицинские данные, и рекомендательная система тоже может быть обучена на медицинских данных. В таком случае синергия достигается даже на узкоспециализированной задаче — например, предсказании наиболее эффективных лекарств или рекомендаций по лечению симптомов. Правильное объединение двух подходов может привести к значительному скачку в качестве и надежности таких систем.