"Яндекс" планирует экспортировать свои речевые технологии за пределы России. Для этого компания наняла топ-менеджера американского разработчика лингвистического и графического софта Nuance Виталия Юрченко. Объем рынка технологий, распознающих голос, может вырасти в ближайшие годы до $10 млрд, прогнозируют эксперты.
"Яндекс" нанял Виталия Юрченко — бывшего регионального директора американской Nuance в России и СНГ, разрабатывающей лингвистическое и графическое ПО, сообщили "Ъ" в "Яндексе". Господин Юрченко возглавил департамент развития бизнеса речевых технологий и продуктов Yandex SpeechKit. "В Европе и США уже начались встречи",— уточнили "Ъ" в компании. На первом этапе переговоры идут об интеграции речевых технологий "Яндекса" в автопром. В конце августа "Яндекс" подписал соглашение с КамАЗом, объявил о работе с Toyota, ранее встроил свой "Навигатор" в Honda и начал переговоры с другими автопроизводителями.
Сейчас обсуждается работа над проектами, связанными с connected cars ("подключенные автомобили") и голосовым управлением автомобилем. "Речь идет о мировых производителях",— подчеркивают в "Яндексе", не раскрывая названий компаний--потенциальных партнеров. Кроме того, команда Yandex SpeechKit договорилась об интеграции голосового комплекса в колл-центры с несколькими российскими банками. "Соглашения на финальной стадии подписания",— утверждают в "Яндексе".
"Яндекс" представил собственный комплекс речевых технологий SpeechKit в 2013 году, с тех пор он используется в его навигационных, картографических и поисковых сервисах. Речевые технологии понимают смысл слов, а также не только слушают человека, но и отвечают ему с помощью технологии синтеза речи. SpeechKit распознает речь на русском, украинском, английском и турецком языках. Только за год — с лета 2015 года по лето 2016 года — SpeechKit распознал почти 1,2 млрд голосовых запросов, которые суммарно длились 1,677 млн часов. Качество распознавания зависит от тематики запроса: для географических названий оно составляет 95%, для коротких текстов — 88%, для текстов вроде заметок и SMS — 82%.
По словам главы Yandex SpeechKit Дениса Филиппова, речевые технологии "Яндекса" сегодня могут использоваться уже не только в массовых сервисах и приложениях. "Объемы поисковых данных и инфраструктура для работы с нейронными сетями позволяют "Яндексу" выйти на перспективный B2B-рынок с охватом различных сфер бизнеса в телекоммуникациях, медицине, автопроме, мобильной связи и даже для управления бытовыми устройствами,— рассчитывает он.— На этом рынке могут существовать как стандартные бизнес-модели (оплата по числу голосовых запросов, приобретение лицензий на продукты), так и перспективные модели (оплата за результат по итогам KPI)".
Рынок речевых технологий и голосового управления переживает значительный подъем, сегмент растет по всему миру, соглашается гендиректор "Центра речевых технологий" Дмитрий Дырмовский. По его словам, направление востребовано во многих отраслях — от банков до потребительской электроники. "Особенно большой потенциал мы видим в развитии голосовых ассистентов и "интернета вещей"",— говорит он.
Голос — это данные, а "Яндекс" — одна из тех редких компаний, которая способна производительно работать с огромными их массивами, рассуждает управляющий портфелем Фонда развития интернет-инициатив Сергей Негодяев. По его словам, по мере удешевления вычислительных мощностей, роста скоростей передачи данных в сетях и появления все более сложных алгоритмов обработки Big Data голосовые интерфейсы управления могут стать массовыми. "Корпорации ежегодно тратят десятки миллиардов долларов на содержание колл-центров. По мере развития речевых интерфейсов они готовы будут перенаправить свои бюджеты на автоматизацию работы с клиентами",— продолжает господин Негодяев, добавляя, что через пять-шесть лет аналитики обещают мировому рынку распознавания речи объем $5-10 млрд.