Решающий голос
На что способны голосовые помощники, и в чем их слабость
За популяризацию голосовых ассистентов принято благодарить коронавирусные локдауны: число обращений в онлайн-сервисы резко выросло, люди потянулись к «живому» общению. Однако переломный момент случился намного раньше — с бумом нейронных сетей в начале 2010-х. С тех пор понимание и моделирование естественных языков вышло на новый уровень — сегодня голосовому помощнику можно поручить очень многое: от колыбельной ребенку до продажи квартиры. Тем не менее около 67% клиентов контакт-центров все еще предпочитают общаться с человеком, а бота, как подсчитал Teleperformance, выбирают только в 8% случаев. “Ъ” побеседовал с экспертами о том, как меняется рынок «голосовиков», насколько он зрелый и какие сложности ему предстоит преодолеть.
Фото: РИА Новости
Боты разные важны
Рынок стремится к омниканальности и предлагает множество вариантов тем, кто предпочитает общаться «голосом»: от интерактивных голосовых меню до диалоговых систем — нейросетей, способных вести полноценный разговор. Встретить такого помощника можно уже практически в любой сфере услуг, будь то банковское приложение или колл-центр медицинской клиники.
Несмотря на многообразие, общепринятой классификации голосовых помощников до сих пор нет. Однако глобально выделяют тех, кто ориентирован на большой круг тем, и тех, кто заточен под узкие задачи. «Первые — это с так называемой функцией болталки (chit-chat) вроде "Алисы" от "Яндекса" или "Маруси" от VK: они обладают широким набором навыков и умеют поддерживать беседу на свободную тему. Вторые — нишевые ассистенты, например "Олег" от "Тинькофф" и "Ева" от "МегаФона". Они не расскажут о погоде и не посоветуют фильм, зато помогут узнать задолженность по кредиту и ответят за вас на звонок»,— перечисляет Юлия Рыжих, директор по маркетингу Just AI.
Если преимущества для пользователей очевидны, то для бизнеса основные аргументы в пользу подключения голосовых ботов — автоматизация, ускорение, экономия. «По нашему опыту роботы повышают производительность обработки клиентских запросов в пять-семь раз. И позволяют экономить до 50–60% фонда оплаты труда операторов прежде всего за счет снятия рутинных, типовых задач»,— делится руководитель департамента аудита и разработки продуктов Voxys Христина Зубрицкая. Голосовой бот в десятки раз быстрее человека, он способен обзванивать сотни клиентов одновременно, дополняет гендиректор аутсорсингового колл-центра Smarter Сергей Щербина. Кроме того, по его словам, ассистента можно использовать для работы с уже «выжатыми» базами: «В нашей практике конверсия на таких проектах достигает 5%: база из миллиона контактов в среднем дает 50 тыс. дополнительных заявок».
Внедрение голосовых помощников положительно сказывается и на лояльности клиентов, указывает директор по продукту цифровизации клиентского сервиса в дистанционных каналах BSS Юлия Вдовина: «Если бот в разы сокращает время ожидания, предугадывает вопросы и вовремя передает "руль" оператору, он однозначно снижает отток пользователей».
Эффект может быть и имиджевый. В этом плане наиболее заметны корпорации-экосистемы — они контролируют десятки продуктов и услуг разной направленности и потому способны предложить максимально бесшовный, запоминающийся пользовательский опыт. На мировой арене это Amazon, Google, Microsoft и Apple. На отечественном рынке с сильным отрывом лидирует «Яндекс» с «Алисой»: по оценке Just AI, в 2020 году ее выбрали 45 млн из 52 млн российских пользователей. Для сравнения: аудитория семейства «Салют» от Сбербанка в этот же период за два месяца с небольшим после запуска приблизилась к 2 млн.
Весь российский сектор речевых технологий с учетом госзаказов в 2020 году оценивался в $76 млн, а к 2025 году может превысить полмиллиарда долларов, прогнозировали аналитики Just AI. И хотя наш рынок растет на десятки процентов, в общемировом масштабе его доля невелика: с $1,5 млрд в 2020-м глобальный рынок может вырасти до $14 млрд к 2030-му.
От хама к помощнику и другу
В ближайшие годы голосовых ассистентов «трудоустроят» практически во всех сферах, где не требуется многошаговое общение с большой вариативностью сценариев, прогнозируют собеседники “Ъ”. Уже охвачены банки, телеком, e-commerce и пользовательские гаджеты, а в перспективе «заговорят» ЖКХ, HoReCa, транспорт и другие индустрии. Голосовые ассистенты проникают даже в космос: летом текущего года NASA отправит Amazon Alexa к Луне.
При этом примерно половина компаний не собирается подключать голосовых ассистентов, указывает технический директор Mdinc Мария Каряева. По ее мнению, в основном предприниматели опасаются сложностей, связанных с обучением и поддержкой таких ботов. Действительно, на текущем этапе развития к голосовым помощникам немало вопросов: от уровня эмпатии до сохранности данных.
Одно из главных препятствий для популяризации речевых решений — их отраслевая немасштабируемость, отмечает директор по исследованиям MTS AI Никита Семенов. «Нельзя взять цифрового ассистента из телекома, немного его доработать и получить бота для производителя сельхозоборудования,— говорит он.— Придется начинать заново, потому что пользовательские сценарии, продукты и специфика бизнеса совершенно разные». Вопрос кастомизации важен и для пользователей, считает руководитель направления «Дополнительные продукты» «МегаФона» Дмитрий Кишилов: «Люди хотят большей персонализации — чтобы у помощника был особенный голос и характер, чтобы он учитывал именно их расписание, правильно реагировал на перебивания и т. д.».
«Пока еще не найдены все ниши»
Вице-президент разработчика облачной платформы для коммуникаций Voximplant Михаил Лесков — о настоящем и будущем голосовых ассистентов.
— Как бы вы охарактеризовали текущую стадию развития рынка голосовых помощников? Далеко ли еще до насыщения?
— Сфера использования голосовых помощников может быть намного шире, чем сейчас. Очевидно, что степень насыщения в B2B-сегменте пока еще низка. Например, в колл-центрах можно внедрять суфлеры, анализ текста «на лету», контроль ключевых слов и другие решения на основе технологий NLP и NLU. Лидеры внедрения — банки и телеком. Российские банки в технологическом плане сегодня одни из самых продвинутых в мире. Отстают логистика и ритейл. Там виден огромный потенциал уже сейчас — например, с подтверждением адреса и времени доставки заказов голосовой робот отлично справится уже сейчас.
— Каким может быть эффект использования речевого бота-ассистента для бизнеса?
— Минута работы оператора колл-центра стоит 10–15 руб., а робота — до 5 руб. (обычно 4 руб.). Разница примерно в три раза. Например, для колл-центра службы доставки можно автоматизировать от 30% до 70% коммуникаций с клиентами. Экономия — это важно, но это далеко не самое интересное. Важнее, что бот помогает зарабатывать, и тут экономический выигрыш может быть огромным. В конце февраля — начале марта наблюдалось настоящее цунами звонков в банки и в ритейл. Колл-центры не сумели быстро масштабироваться, и не все справились с этим наплывом звонков. Ритейлеры из-за необработанных звонков потеряли 10–15% своих заказов. В масштабах страны это гигантская сумма. Если бы во всех колл-центрах работали интеллектуальные голосовые-помощники, то количество необработанных заказов было бы в разы меньше.
— Какие факторы сейчас тормозят развитие рынка? Какие, наоборот, ему способствуют?
— Сдерживает недостаток R&D в этой области. Пока еще не найдены все ниши, где можно применять голосовых роботов. Видны нехватка специалистов и нишевый характер их работы. Недостаточна конкуренция среди тех, кто упаковывает технологии в готовый продукт.
Способствует высокий уровень развития самих речевых технологий и российских разработчиков. Несмотря на то что в целом в мире количество специалистов в области NLP и NLU, работающих с русским языком, намного меньше, чем с английским, технологически уровень распознавания голоса на русском находится почти на том же уровне, что и на английском.
— Насколько сильно ударили геополитические потрясения по вашей компании?
— В какой-то момент бизнес просел, а потом, наоборот, резко вырос, но в целом телеком относится к циклической сфере экономики, которая не становится жертвой кризисов, а, наоборот, защищает от них другие сферы экономики. Тот же абонент мобильного оператора может в кризис отключить VIP-опции, но не перестанет пользоваться связью и интернетом. Поскольку мы тесно связаны с телеком-отраслью, то на ключевом бизнесе Voximplant минувшие события отразились даже в сторону большей востребованности.
— Каким вы видите будущее рынка голосовых помощников?
— Рынок движется в сторону стандартизации, массовости и расширения границ применимости. Появится больше специалистов по использованию голосовых роботов, больше продуктов, коробочных решений для среднестатистического бизнес-пользователя. Снизится порог знаний, необходимых для использования голосовых технологий. Скорее всего, появится больше Low-Code и No-Code платформ, позволяющих настраивать роботов без участия программистов. Еще одним трендом может стать включение системными интеграторами голосовых продуктов в свой пакет услуг. Речь идет о сложных кастомных решениях. Пока в области голосовых технологий интеграторы представлены слабо.
Еще одна наболевшая проблема — все еще недостаточная сообразительность, рассуждает Игорь Ганин, операционный директор «Виджета», резидента «Сколково»: «Ассистент может запутаться и некорректно отреагировать на запрос пользователя. В лучшем случае собеседник разозлится, в худшем ошибочная интерпретация приведет к неверному решению». Более того, случается, что боты грубят клиентам, а «Олег» даже предлагал клиентке банка отрезать пальцы. Основатель компании «Биорг» Георгий Зуев объясняет это неручным обучением на открытых данных: «Автоматический метод — быстрый, но на выходе можно получить много ошибок и репутационные риски. На рынке голосовых помощников пока что есть некоторая доля техношовинизма, то есть идеи "цифровизации любой ценой". Это может оттолкнуть многих».
Впрочем, трудности преодолимы, уверены эксперты, ведь постепенно виртуальные ассистенты «взрослеют», становятся умнее и эмпатичнее. Глобально такие боты развиваются по двум направлениям, уточняет CEO SberDevices и вице-президент по цифровым поверхностям «Салют» Сбербанка Денис Филиппов: «Ось полезности или IQ — это набор навыков. Их становится все больше, а качественно новый шаг будет связан с появлением проактивности: предложить пользователю заказать продукты, спеть его любимую песню. Другая ось развития — эмоциональный интеллект или EQ. Люди компенсируют недостаток общения, и важно работать над тем, чтобы ассистенты могли уместно поддержать, подбодрить. У виртуальных ассистентов есть огромный потенциал, чтобы стать не только помощником, но и другом».
«Быстро справиться с вызовами можно в том числе благодаря воспитанию самообучаемости. В какой-то мере она уже присутствует: все разговоры с ботами записывают, затем анализируют и "тюнят" алгоритмы. Но пока что доля автоматизации невелика»,— резюмирует Виталий Киселев, руководитель направления голосовых помощников и чат-ботов 3iTech.
Выход на плато или выход с рынка?
Аналитики Gartner считают, что сектор речевых технологий — особенно с участием искусственного интеллекта — прошел пик завышенных ожиданий и в рамках ближайшего десятилетия выйдет на плато продуктивности. Это справедливо для наиболее популярных языков и отраслей, согласны опрошенные “Ъ” специалисты. Однако пока рынок находится на стадии развития, и любые изменения конъюнктуры для него довольно чувствительны. Глобальный эффект от технико-экономических сдвигов после 24 февраля еще предстоит оценить, но пока эксперты не настроены пессимистично.
«Россия однозначно входит в пятерку стран—лидеров в области голосовых ассистентов. Так что временная изоляция не грозит отечественным разработчикам простоем, а реализованные внутри страны решения останутся востребованными на внешних рынках»,— уверяет Марат Девликамов, исполнительный директор Twin. «Ценен не только готовый голосовой софт — важны платформы для его создания, где можно собрать ассистента с любым функционалом по типу конструктора. В России уже есть топовые решения с понятным интерфейсом, а у большинства западных, европейских стран их нет совсем»,— продолжает руководитель направления Exon.Smart компании Gaskar Group Владислав Пыльский.
С другой стороны, развитие рынка голосовых помощников зависит от доступности физической IT-инфраструктуры, качества кадров, стоимости лицензий и множества других факторов, напоминает Михаил Попов, основатель финтех-платформы TalkBank: «В мире речевые технологии продолжат быстро развиваться — глобальная кооперация снижает издержки и обеспечивает больше данных, в результате чего получаются более "умные" системы. Часть государственных мер по преодолению санкций смягчат удар для части российского рынка, но многим игрокам придется заново выстраивать процессы — вполне вероятно, в долгосрочной перспективе это приведет к отставанию».