Говорит и подсказывает
Как создавался чатбот «Евгений Густман»
В июне 2014 года текстовый робот «Евгений Густман», написанный выходцами из России и Украины, смог первым в мире пройти тест Тьюринга. По просьбе «Секрета фирмы» один из отцов «Густмана» Владимир Веселов рассказал о том, для чего нужен тест Тьюринга, как создавался робот-победитель и чем он и другие диалоговые системы могут быть полезны человечеству.
Мечты сбываются. Я не могу отвечать за всех своих коллег на вопрос, что нас вдохновило на создание «Евгения Густмана», скажу про себя. Помните, был такой фильм «Отроки во Вселенной»? Там главные герои попадают на другую планету и спасают ее от взбунтовавшихся роботов. Рядовых роботов им удается обмануть загадкой про «А» и «Б» на трубе, но продвинутые, не задумываясь, отвечают «Осталась ваша буква И». В фильме, правда, продвинутые роботы не особо симпатичные. Они хотят «осчастливить» людей и лишить их эмоций. Но когда я смотрел этот фильм в детстве, то думал не об этом, а о том, как здорово было бы вырасти и сделать такого говорящего робота.
История «Евгения Густмана» началась в 2001 году с поисков правильного пути. Я и мои коллеги по компании Princeton Artificial Intelligence задумались над тем, как приспособить для решения различных задач разработанную нами программу. Она была основана на выполнении правил и могла быть использована в нескольких областях. Первая область — создание чатбота, запрограмированного текстового робота, который способен вести диалог с людьми. Вторая — система обработки текстов. Третья — система расчета стоимости медицинской страховки в зависимости от пола, возраста и предпочтений пациента. Все три варианта были довольно перспективными, но вариант с чатботом вдобавок ко всему позволял нам принять участие в конкурсе на прохождение теста Тьюринга Loebner Prize и в случае победы прорекламировать нашу программу. Мы решили попробовать.
Что такое тест Тьюринга и для чего он нужен? Судя по полемике, развернувшейся в интернете, далеко не все это понимают. В 1950 году выдающийся английский математик Алан Тьюринг написал статью «Вычислительные машины и разум». В то время уже велись дискуссии об искусственном интеллекте, о том, могут ли ЭВМ мыслить. Тьюринг сразу ответил, что данный вопрос даже не заслуживает обсуждения: машина мыслить не может, но зато ЭВМ способна решать сложные задачи и имитировать поведение людей. Тьюринг предсказал, что к 2000 году ЭВМ будут это делать настолько хорошо, что у их собеседников останется не больше 70% шансов распознать, общаются они с человеком или с машиной. Конкурсы по прохождению теста Тьюринга как раз об этом. 70% Тьюринг указал не случайно. Это статистический порог, показывающий, что зафиксированный факт не может быть случайностью. Тьюринг немного не угадал с прогнозом. Пройти барьер в 30% компьютеру удалось только в 2014 году.
Нужно было наделить чатбот человеческими чертами и сделать интересным собеседником. Двое моих коллег — Евгений Демченко и Михаил Гершкович — родились в Мариуполе и Одессе. Именно они и заложили в «Евгения Густмана» украинские корни. Самого персонажа с характером 13-летнего одессита предложил Демченко. Всем понравилось. Демченко замечательно справился с тем, чтобы воспроизвести непростой характер подростка. Евгений просто вжился в его образ — в каждой фразе робота постарался передать его настроения и убеждения. Именно поэтому Густман периодически дерзит и рассказывает про свою морскую свинку. Ну а возраст и местожительство — отличное объяснение того, почему он не понимает некоторых вопросов по-английски или не хочет на них отвечать.
Основное преимущество «Евгения Густмана» в том, что он представляет собой по сути литературное произведение. Все фразы бьют в одну цель — поддержать целостность непростого характера «Евгения». В 2001 году «Густман» принял участие в Loebner Prize и вместе с роботом Ella поделил 2-е и 3-е места. После этого «Евгений» еще много раз участвовал в конкурсах на прохождение теста Тьюринга и занимал призовые места. Ближе всего к победе он был в 2012 году. Тогда до прохождения барьера в 30% не хватило всего 0,8%. Сейчас в мире существует довольно много чатботов. Из известных могу назвать ту же Ella, Alice, Façade, ChatScipt. У каждого есть свои сильные и слабые места.
«Википедию» и «Коммерсант» «Густман» не читает. Все его новые суждения и реплики приходится добавлять вручную. Автоматизировать процесс сбора информации и добавления новых знаний с учетом характера робота нам так и не удалось. Сейчас мы с партнерами работаем в разных компаниях, а чатботом занимаемся в свободное время, поэтому о некоторых вещах у «Густмана» представления немного устарели.
Тест пройден, а что дальше? Не думаю, что произошло нечто экстраординарное после того, как наш «Евгений Густман» смог в 33% случаев убедить жюри в том, что он человек. Все-таки возможности чатботов еще очень далеки от совершенства. «Густман» продержался всего пять минут — именно столько нужно по условиям теста. Для 1950 года это было серьезным достижением, но современный мир этим уже не удивишь. Нужно двигаться дальше.
Программу, на которой был написан «Густман», мы продали российской компании iFree. Сумму сделки раскрыть не могу, но это были не миллионы долларов. iFree нашу технологию доработала и использует теперь в виртуальных помощниках. Вообще виртуальные помощники (так называемые personal assistant) — это пока наиболее распространенное применение программ, имитирующих действия человека.
Самый известный виртуальный помощник — Siri, его знает каждый пользователь iPhone. Эта голосовая диалоговая система отвечает на вопросы пользователя и дает ему подсказки, ориентируясь на его индивидуальные предпочтения и действия. Стартапов, которые сейчас пытаются работать в этом направлении и создавать на базе таких диалоговых программ еще что-то полезное для пользователей, довольно много. Все они пока, впрочем, далеки от совершенства. Если технология будет развиваться, применений ей множество: системы обучения, умные игрушки (особенно для детей страдающих аутизмом), говорящая бытовая техника, те же виртуальные помощники и консультанты, но только более продвинутые. В мире много людей, которые не очень дружат с техникой. Прочитать и разобраться в инструкции стиральной машины иногда с трудом может и кандидат наук. А тут система сама расскажет, что она может, поймет, что от нее нужно, и все сделает без участия человека.
Создать идеальную систему, которую в 100% случаев будут принимать за человека, вряд ли получится. Если сравнивать имитирующие поведение человека компьютеры с ракетами, то можно сказать, что мы только оторвались от стартового стола. В начале XX века Константин Циолковский опубликовал уравнения многоступенчатой ракеты, но ракета достигла космоса лишь в 1954 году. Идея понятна, но нужно много чего проработать, изобрести, решить. На мой взгляд, 100% случаев — недостижимый результат: даже если человечество отупеет, то по разумности ответов робота, судьи поймут что перед ними робот.
Увеличить результат прохождения теста Тьюринга до 50% можно. И это будет означать, что робот практически неотличим от человека. Я не знаю, когда это произойдет. Если кому-то это понадобится, лет за 10-15 лет эту задачу можно решить. Еще раз приведу в пример космос. Если бы не необходимость создания баллистических ракет и соперничество между СССР и США, то, наверное, никто бы никуда не полетел. И еще я очень надеюсь на молодое поколение, ведь наш 13-летний «Густман» — это в том числе и призыв к нему: дерзайте, не верьте, что что-то невозможно (даже если вам так говорят), создавайте новое. И у вас получится.