Ученые давно обсуждают возможность появления искусственного интеллекта (ИИ), умеющего распознавать человеческие эмоции. Уже создано немало инструментов такого рода — но они обычно основаны на распознавании эмоций по лицу человека, а точность этого метода вызывает много вопросов. Теперь же исследователи из Массачусетса разработали модель, которая может не просто определять, а предсказывать эмоции, причем руководствуясь совсем другими критериями.
Фото: Евгений Павленко, Коммерсантъ
Распознавание эмоций может быть полезно в самых разных сферах: от определения эмоций при контакте с бизнес-партнерами, коллегами или студентами исключительно онлайн до использования технологии в носимых гаджетах и медицине. Однако существующие модели такого рода — в первую очередь определяющие эмоции по выражению лица — вызывают довольно много критики.
На этой неделе нейробиологи из Массачусетского технологического института (MIT) опубликовали в британском научном журнале Philosophical Transactions of the Royal Society A статью, посвященную построению компьютерной модели такого рода. Она может предсказывать эмоции людей — в том числе радость, благодарность, замешательство, смущение, сожаление.
Как отмечает участница исследования профессор когнитивной нейробиологии MIT Ребекка Сакс, часто подобные разработки основное внимание уделяют распознаванию эмоций по выражению лица, однако сам по себе этот навык — не самая важная часть эмоционального интеллекта человека.
«Самое важное в понимании эмоций других людей — предсказывать, что люди почувствуют, до того, как это произошло. Если бы весь наш эмоциональный интеллект был бы исключительно реактивным, это было бы катастрофой»,— считает госпожа Сакс.
Иными словами, модель должна не определять уже выраженные эмоции, а предсказывать эмоциональную реакцию на те или иные события.
Задача, поставленная учеными, заключалась в том, чтобы модель предсказывала эмоции людей в ситуациях, описываемых так называемой дилеммой заключенного. Это пример из теории игр, когда двое «заключенных» независимо друг от друга должны принять решение о сотрудничестве или предательстве.
Как отмечают авторы исследования, при построении модели они включили несколько факторов, которые могут влиять на эмоции людей. Среди этих факторов — желания людей, их ожидания в конкретных ситуациях, тот факт, наблюдает ли кто-то за ними, и так далее.
Для построения модели ученые взяли сценарий британской телеигры Golden Balls. В ней на каждую пару участников выделяется $100 тыс. После обсуждения в паре каждый ее участник должен принять решение, разделить ли награду или играть только за себя. Если оба выбирают разделение, каждый получает по $50 тыс. Если один готов разделить, а другой решает играть за себя, последний получает все $100 тыс. Если же оба игрока отказываются от сотрудничества, никто ничего не получает.
В ходе игры участники испытывают разные эмоции — от радости и гнева до смущения. Компьютерная модель должны выступить в роли наблюдателя за игрой — и восстановить те шаги, которые приводят наблюдателя к выводу об эмоциях участников. Для создания модели, предсказывающей эти эмоции, исследователи выделили три отдельных модуля.
Первый из них учили делать выводы о предпочтениях и убеждениях человека на основе действий человека. Для этого применялось так называемое обратное планирование: выводы о том, чего человек хотел и ожидал, на основании его последующих действий. Второй модуль сравнивал результаты игры с тем, чего хотел и ожидал каждый игрок. Наконец, третий модуль учили делать выводы об эмоциях игроков на основании их ожиданий и итогов игры.
«На этих данных модель учится, что, например, чувствовать сильную радость в такой ситуации означает получить то, что ты хотел, получить это честно и без обмана»,— отмечает Ребекка Сакс.
По ее словам, построение модели показывает, что люди хотят не просто получить деньги, но и сделать это так, чтобы не выглядеть в глазах окружающих ни обманщиком, ни тем, кого легко обмануть.
Далее ученые сравнили оценку эмоций, демонстрируемых компьютерной моделью, обученной на таких примерах, с оценкой людей, наблюдающих за игрой. По словам авторов исследования, уровень точности массачусетской модели был выше, чем у какой-либо другой модели, созданной для определения человеческих эмоций. В дальнейшем исследователи из MIT собираются развивать модель таким образом, чтобы она могла делать прогнозы об эмоциях людей в более сложных ситуациях, чем искусственно созданная ситуация игры.
«Исследователи помогли выстроить более глубокое понимание того, как эмоции воздействуют на наши действия; а затем, переворачивая эту модель, они показывают, как мы можем использовать действия людей для понимания лежащих в основе этих действий эмоций. Это направление работы помогает нам увидеть эмоции не просто как "чувства", но и как то, что играет существенную и при этом трудно различимую роль в социальном поведении человека»,— прокомментировал исследование профессор британского Уорикского университета Ник Чатер, специализирующийся на изучении поведения человека.
Систем распознавания эмоций по лицу человека много. Правда, многие эксперты сомневаются в точности таких инструментов. Например, HR-сервис HireVue некоторое время использовал систему распознавания эмоций по лицу во время собеседований. Однако затем компании пришлось от этого отказаться из-за критики технологии за «псевдонаучность» и неверную оценку реальных эмоций.
Подобные системы уже пытались использовать и полицейские в разных странах, что также вызывало критику как с точки зрения вмешательства в частную жизнь, так и с точки зрения точности подобных инструментов. Власти ЕС собираются запретить системы такого рода, посчитав их нарушающими права человека.
Основные вопросы у экспертов вызывает даже не точность определения выражений лица, а сама возможность понять по ним реальные эмоции человека.
По мнению Кейт Кроуфорд, соосновательницы исследовательского института AI Now Institute, работающего при Нью-Йоркском университете и изучающего социальные последствия внедрения ИИ, сами по себе такие системы построены «на очевидно шатких основаниях».
«Они претендуют, если хотите, на понимание наших внутренних эмоциональных состояний на основании микровыражений лица, тона голоса и даже того, как мы ходим,— отмечает госпожа Кроуфорд.— И в то же самое время, когда эти технологии распространяются, большое количество исследований показывает, что нет существенных доказательств наличия у людей устойчивой связи между эмоциями, которые они испытывают, и тем, как выглядит их лицо».