«Олег» займется бизнесом
Тинькофф-банк предложит речевые технологии корпоративным клиентам
Управляющая Тинькофф-банком TCS Group выводит на рынок b2b разработки в сфере речевых технологий. На их основе уже работает голосовой помощник Тинькофф-банка «Олег», а сторонние компании, как предполагается, смогут развивать собственных голосовых ассистентов или роботов для колл-центров. На этом рынке объемом около 3 млрд руб. в год TCS Group придется конкурировать с «Яндексом» и целым рядом крупнейших компаний, развивающих подобные технологии.
TCS Group (включает Тинькофф-банк, «Тинькофф Мобайл», «Тинькофф Страхование» и «Тинькофф Центр разработки») начинает продавать речевые технологии корпоративным клиентам, рассказали “Ъ” в пресс-службе группы. Набор инструментов Tinkoff VoiceKit может использоваться, например, для создания голосового ассистента, роботов для автоматизации колл-центров, построения системы аналитики по транскрибированным текстам, а также создания аудиокниг, говорят в TCS Group.
TCS Group представила голосового помощника «Олега» в июне 2019 года. «Олег» обучается на базе суперкомпьютера «Колмогоров», о запуске которого группа объявила 2 апреля. По данным TCS Group, на разработку и запуск речевых технологий без учета оборудования и затрат на «Колмогорова» ушло около 80 млн руб. за три года. «Наши первые клиенты считают, что качество распознавания выше, чем у решений, которые они использовали до этого. Особенно это касается телефонной речи, поскольку у нас накоплено очень много данных в этой области и мы можем обучать нейросетевые модели, используя "Колмогоров" на всем их объеме»,— заявил вице-президент TCS Group Вячеслав Цыганов.
На корпоративном рынке TCS Group намерена конкурировать с технологией распознавания и синтеза речи «Яндекса» Yandex.SpeechKit, инструменты которой были впервые представлены в 2013 году.
Стоимость использования Tinkoff VoiceKit для корпоративных клиентов с целью распознавания речи в среднем составит 40–45 коп. за минуту двухканального аудио, говорит представитель группы, для образовательных учреждений и студентов сервис будет бесплатным.
В «Яндексе» не стали комментировать выход технологий TCS Group в корпоративный сегмент. Сама компания использует технологии синтеза и распознавания речи в голосовом помощнике «Алиса» и «Яндекс.Навигаторе», среди корпоративных клиентов — «МегаФон», МТТ, Модульбанк, Just AI и другие, сообщил представитель интернет-компании, отметив, что Yandex.SpeechKit позволяет им решать спектр задач «от полной автоматизации колл-центра до речевой аналитики для бизнес-нужд».
Mail.ru Group также активно развивает речевые технологии, включая собственные системы распознавания и синтеза речи вместе с диалоговым движком, говорит директор по технологиям искусственного интеллекта Mail.ru Group Андрей Калинин. «Самые заметные примеры использования технологии — это голосовой помощник "Маруся" и b2b-сервис аудиоаналитики Sounds. В рамках работы MRG Tech Lab мы рассматриваем разные сценарии применения речевых технологий во всех элементах экосистемы Mail.ru Group»,— отметил он. По словам господина Калинина, почти все крупные компании с экспертизой в сфере искусственного интеллекта так или иначе работают с речевыми технологиями, в том числе Microsoft, Nuance и Центр речевых технологий (ЦРТ; контролируется Сбербанком).
ЦРТ предлагает такие продукты на базе речевых технологий, как запись и очистка от шумов диалогов с клиентами, распознавание и синтез речи, анализ голосовых сообщений и индустриальные решения для голосового сопровождения деятельности сотрудников, перечисляет коммерческий директор ЦРТ Андрей Лысков. Разработки на базе технологий компании используют операторы связи «большой четверки», крупные банки и госкомпании, а также правительства Москвы и Санкт-Петербурга, говорит он. «Распознавание речи в телефонном канале — задача решенная, последние годы ЦРТ сконцентрирован на повышении качества распознавания в сложных условиях: улица, общественный транспорт, магазин, офис обслуживания»,— добавил господин Лысков.
По оценке ЦРТ, объем российского рынка речевых технологий в 2018 году составил 2,5–3 млрд руб., а по итогам 2019-го может вырасти на 25%.
Точно определить размер этого рынка сложно, отмечает гендиректор Voximplant Алексей Айларов, распознавание речи используется в рамках других продуктов и сервисов, а, например, мировой рынок искусственного интеллекта и больших данных к 2022 году достигнет $40 млрд.