Компания "Центр речевых технологий" (ЦРТ) планирует к концу года предложить рынку продукт, позволяющий владельцу сотовой трубки обходиться с телефоном без физического контакта — все действия можно будет совершить голосовыми командами. Несмотря на постоянные изыскания софтверных компаний в сфере речевых технологий, опыт ЦРТ является одним из немногих случаев их практического применения.
Менеджер по зарубежным контактам ЦРТ Юлия Хитрова сообщила, что непосредственной сборкой DiVo займется немецкий партнер, имя которого она сообщить отказалась, сославшись на коммерческую тайну. Ориентировочная цена изделия — $200.
Разработка ЦРТ — один из немногих случаев промышленного применения речевых технологий. Гендиректор другой софтверной компании "Санта-Барбара", также ведущей изыскания в сфере распознавания речи, Арсений Березин считает, что пока все технологии работы с голосом можно воспринимать лишь как инструмент "для создания игрушек, далеких от практического применения". Виной тому — уникальность речевых фонем. "Например, компьютер с трудом понимает слово, произнесенное ребенком, тогда как то же слово, сказанное взрослым, распознает запросто", — пояснил господин Березин. Большое значение имеет и акцент говорящего — современные устройства перестают воспринимать речь при малейшем его наличии.
Впрочем, в неповторимости голосового спектра есть и плюсы. Арсений Березин считает, что голос уникален подобно отпечатку пальца, и это обстоятельство можно использовать, например, в банковских защитных системах. Юлия Хитрова наиболее возможными заказчиками считает call-центры, операторы которых обрабатывают за день до 10 тысяч звонков. При надежной системе распознавания речи абонент может голосом заказать требуемую информацию и получить ответ от робота.
В Петербурге услуги call-центра предоставляют лишь две компании — подконтрольная "Телекоминвесту" "Спик" и оператор "Петерстар". Оба центра были куплены у Avaya Communication (АС). Гендиректор местного филиала AC Юрий Песня сообщил, что с точки зрения "железа" call-центр может поддерживать функцию голосового меню, но необходимого для этого программного обеспечения пока нет: "Обычно такие приложения выполняются третьими компаниями, и все они поддерживают лишь английский язык". Господин Песня также сообщил, что для клиентов такая функция может быть интересна, но пока никто из представителей российских софтверных компаний с предложениями о сотрудничестве не обращался. Гендиректор компании "Спик" Сергей Артамонов тоже считает возможность внедрения систем распознавания речи call-центрами перспективной: "Голосовое меню может существенно сократить время доступа к информации. Донабор цифр в тональном режиме позволяет сократить выбор, но только 10% населения может им пользоваться".
Подобный оптимизм разделяют не все. Старший специалист по услугам телефонии "Петерстар" Дмитрий Остудин уверен, что распознаватель голоса скорее вызовет не деловой интерес, а развлекательный. Скептически относится к такой перспективе и директор по маркетингу оператора "Дельта Телеком" Дмитрий Шкенев: "В существующих телефонных сетях присутствует интерференция, шорохи и помехи. Все это может настолько исказить голос, что даже человек ничего не поймет".
БОРИС ГОРЛИН