Пойми меня
«Промобот» занялся технологиями распознавания речи
Пермский производитель автономных роботов «Промобот» поглотил созданную им же компанию, которая занималась разработкой технологии распознавания речи. Проект завершился успешно, и теперь «Промобот» не только сам использует технологию, но и готов ее продавать предприятиям различных сфер. Эксперты считают, что она будет востребована в маркетинге, медицине, работе с инвалидами. При наличии проблем в развитии этой разработки, технология обладает высоким коммерческим потенциалом.
Пермский производитель автономных роботов ООО «Промобот» стал 100%-ным владельцем ООО «Айбокс Технолоджи», зарегистрированного в Перми в 2018 году. Ранее производитель роботов владел долей в 51%, остальными 49% распоряжался генеральный директор «Айбокс Технолоджи» Игорь Панкратов. По данным «СПАРК-Интерфакс», сделка состоялась в конце марта. Сумма сделки не раскрывается.
Компания «Промобот», созданная в 2015 году, специализируется на производстве автономных сервисных роботов для бизнеса под брендом Promobot. Производство роботов включает в себя разработку мехатроники, электроники и ПО, изготовление компонентов робота и его полную сборку. На сегодняшний день компания произвела свыше 400 единиц техники. География поставок Promobot насчитывает 26 стран мира. В 2018 году компания заключила ряд ключевых контрактов на поставку сервисных роботов в Казахстан, Бразилию, Германию, Кувейт, Гану и Швейцарию. Роботы могут выполнять функции гида, консьержа, промоутера. Один из них работает в пермском многофункциональном расчетном центре (МФЦ), где консультирует посетителей и помогает им в получении услуг.
Основным профилем деятельности «Айбокс Технолоджи» является разработка компьютерного программного обеспечения. Как пояснил директор по развитию ООО «Промобот» Олег Кивокурцев, «Айбокс Технолоджи» занималась разработкой технологии распознавания речи. «Компания завершила научно-исследовательские и опытно-конструкторские работы, и технология готова к масштабированию. Ранее она использовалась в наших роботах, теперь готова к продаже в другие отрасли. Поэтому сейчас фокус на коммерциализации технологии»,— сообщил господин Кивокурцев.
У „Яндекса“ нейронная сеть обучалась на базах данных с телефонных переговоров, а наш робот общается вживую, поэтому для нас важна точность распознавания. „Яндекс“ достиг 85%, тогда как мы — 94%. При этом степень точности распознавания речи технологии Google — 97–98%, но только при наличии интернета»,— добавил господин Кивокурцев.
По оценкам бизнес-ангела, венчурного инвестора Дмитрия Сутормина, технология распознавания речи уже прочно вошла в жизнь, в частности — при голосовом наборе текста на мобильных устройствах и при работе с помощником (Apple Siri, Ok Google, Яндекс Алиса, MS Bing). Кроме того, один из стартапов применил технологию при обучении детей английскому языку.
Еще на одну сферу применения распознавания речи обратила внимание кандидат физико-математических наук, член-корреспондент Международной академии информатизации, доцент ПГНИУ Светлана Чуприна. По ее словам, технологию можно использовать при заполнении медицинских карт во время общения с пациентами.
Однако в рамках развития и применения технологии есть ряд сложностей. «Распознавание речи — вообще уже не удивительная и не прорывная технология. Она уже семь лет живет плотно рядом с нами, но люди ее не всегда замечают. Но если будет массовый спрос, например для управления бытовой техникой, монстры типа Google или Xaomi сделают копеечные лицензии и выдавят с рынка мелких разработчиков»,— заметил господин Сутормин. Однако он указал и на преимущество разработки «Айбокс Технолоджи»: «Проблема встает, как у „Промобот“, когда нужно стабильно и автономно работать. И тут приходится разрабатывать самим. Что они и сделали».
По мнению Светланы Чуприной, существуют три проблемы, которые необходимо решить для успешного развития. «Первая связана с тем, что для качественного распознавания речи многие методы искусственного интеллекта требуют не только больших и очень больших объемов данных, но и соответствующей структуризации и разметки этих данных. А это большой труд, требующий автоматизации, так как зачастую эти данные являются неструктурированными и хранятся, например, в виде обычного текста»,— пояснила эксперт. Второй проблемой, по ее словам, является интеграция различных методов, а вместе с ними — технических средств и грамотных специалистов. Третья проблема связана с «бесшовным» встраиванием голосовых помощников в уже существующие системы.
«В целом мне видится перспективной именно интеграция решений по распознаванию и генерации речи с другими решениями из области распознавания образов: распознавание символов/цифр, как печатных, так и рукописных; классификация документов по содержанию; распознавание лиц, отпечатков пальцев и других изображений, к примеру — штрих-кодов. Это очень востребовано не только в медицине и в системах безопасности и учета, но и в таком благородном деле, как создание интеллектуальных виртуальных помощников для людей с ограниченными возможностями, например, по зрению»,— заключила госпожа Чуприна.
Даже при наличии большого круга нерешенных задач разработку оценивают как коммерчески привлекательную. Аналитик ГК «Финам» Леонид Делицын оценил потенциал рынка распознавания голоса и речи как чрезвычайно высокий: «Область применения расширяется так быстро, что оценки объема мирового рынка отличаются на порядки». По его данным, максимальная оценка объема рынка составляет $147 млрд в 2019 году, в то время как минимальная — лишь $1,9 млрд». При этом минимальная стоимость относится к продаже программного обеспечения для распознавания речи и голоса.
По мнению господина Делицына, рынок уже активно заполняется игроками. «Оценки темпов прироста отличаются не столь сильно и составляют 12–20%. К 2024 году, по различным прогнозам, рынок достигнет объема от $7 до 21,5 млрд, хотя специалисты BCC Research ожидают $184,9 млрд уже в 2021 году. В любом случае речь идет по меньшей мере о $10 млрд, и вряд ли они будут поделены между Google, „Яндексом“ и „Промоботом“. В число ключевых и перспективных игроков рынков включают десятки компаний, в числе которых Microsoft, Amazon, Baidu, Nuance Communications, Raytheon, американская Sensory Inc., китайская iFlytek, британская Speechmatics и другие. Вполне возможно, что не все технологии заслуживают высокого звания „основных“, но они проприетарны и будут конкурировать»,— заключил эксперт.