В Башкирии разработали свою «умную» колонку — аналог известных «Алисы» и «Маруси» — омай (Хомай). Она говорит на башкирском и русском языках, знает историю и культуру родного края, может научить готовить национальные блюда и многое другое. Проект поддержан грантом главы республики. Ожидается, что первые пять колонок будут собраны уже ко Дню республики, в октябре этого года, а к 2024 году планируется выпустить еще 250. Разработчики готовы сделать подобные проекты и для других народов страны. Эксперты считают, что колонки, разговаривающие на нескольких языках, могут быть востребованы.
Оригинальный дизайн колонки еще не представлен общественности. Разработчики прорабатывают различные варианты
Фото: Ольга Корзик, Коммерсантъ
Ближе, доступнее, понятнее
В ближайшее время в Башкирии появится колонка, с которой местные жители смогут разговаривать на родном языке. Программист Айгиз Кунафин разработал «умную» колонку: аналог Алисы от Яндекса и Маруси от ВК — hомай.
Как следует из информации, опубликованной на сайте проекта, hомай — это языковая модель искусственного интеллекта, обученная на корпусе башкирских текстов и живой речи. С ней можно разговаривать на башкирском и русском языках, задавать вопросы и получать развернутые ответы. Колонка знает историю и культуру родного края, расскажет о достопримечательностях республики, научит готовить национальные блюда — зур-бэлэш, кулламу или бишбармак и поможет разобраться в вопросах религии.
Цель проекта, как отмечают авторы, «сделать башкирский язык ближе, доступнее и понятнее». Для этого разработано три профиля общения с умной колонкой, которые отличаются друг от друга степенью включенности русского языка: для начинающих изучать башкирский язык колонка будет говорить на смеси русского и башкирского языков, для уверенно говорящих — только на башкирском.
«У башкироязычного населения сейчас стоит острая проблема: дети не говорят на языке родителей. Это есть не только у башкир и не только в России. Вокруг детей YouTube, игры, ТВ, где в основном информация дается на языке большинства этой страны. В России это русский язык. У детей нет языковой практики. Поэтому мы в лице "умной" колонки видим друга, собеседника, помощника для наших детей. Мы надеемся, что благодаря колонке дети перестанут бояться, что неправильно говорят на башкирском языке, что их могут осмеять», — говорит автор проекта Айгиз Кунафин.
Идея проекта пришла к нему во время пандемии в 2020 году. Сначала Айгиз Кунафин хотел создать сайт, который автоматически бы проверял выполненную домашнюю работу школьников. Но после изоляции этот сайт перестал бы быть актуальным, тогда он решил сделать колонку.
«Сегодня никто из крупных компаний — Яндекс, Сбер, ВК, Мейл.ру и тем более зарубежные, не планируют включать поддержку языков народов РФ в свои колонки. Главная причина — сложно реализовать, а если добавить один язык, то и другие народы начнут просить включить свои языки. Крупным компаниям экономически это не выгодно», — говорит господин Кунафин.
Самым сложным, по его словам, стало то, что у его команды ранее не было опыта создания подобных проектов.
«Также мы переживаем за то, что у людей есть некое ожидание по цене, внешнему виду, контенту на основе колонок Алиса, Маруся и т.д. С одной стороны, наша колонка будет похожа на них, но с другой — мы хотим через внешний вид показать связь с башкирской культурой и языком. Также hомай будет отличаться по контенту: наша колонка не развлекательный девайс, который ставит музыку, мы выбрали образовательный вектор, который направлен на сохранение и изучение языка и культуры», — подчеркивает Айгиз Кунафин.
Проект поддержан грантом главы Башкирии Радием Хабировым. Директор Фонда по сохранению и развитию башкирского языка Гульназ Юсупова сообщала ТАСС о том, что к 2024 году будет выпущено примерно 250 таких устройств. Они будут переданы в школы и детские сады.
«Планируем, что первые пять колонок будут собраны к 11 октября, на День Республики», — приводит слова Гульназ Юсуповой ТАСС.
До конца жизненного цикла
По словам Айгиза Кунафина, процесс производства колонки практически полностью будет проходить в России.
«ПО мы пишем сами. Сборка тоже будет проходить в России. Единственное, пока мы вынуждены заказывать комплектующие в Китае», — делится автор проекта.
Назвать полную стоимость проекта Айгиз Кунафин затруднился.
«Смотря что подразумевать под проектом — текущие задачи по грантам или дальнейшее развитие продукта. Дело в том, что под проектом мы сами подразумеваем "умную" колонку, похожую на Алису. Она будет уметь гораздо больше, чем то, что мы делаем сейчас. Это значит, что мы должны работать над проектом и после того, как закончатся задачи в рамках наших текущих грантов для детских садов и школ. Татарские студенты создали умную колонку на татарском языке полгода назад. При этом они делали расчет, что на создание такого проекта надо 40-60 млн руб. Думаю, что это минимум», — говорит Айгиз Кунафин.
«Разработка голосового помощника, по разным данным, сейчас будет стоить в среднем от $ 20 тыс. до 55 тыс. (2-5,3 млн руб.). В эту сумму не входят издержки на маркетинг, комплаенс, обслуживание системы после запуска и т.п. Нужно понимать, что после коммерческого выпуска голосового помощника его работу необходимо мониторить и корректировать до конца жизненного цикла, что увеличивает издержки на продукт. Очень важно обращать внимание на принципы этики искусственного интеллекта, чтобы избежать в будущем роста издержек из-за неправильной работы ИИ и связанных с этим правовых рисков. Впервые такие принципы на международном уровне были разработаны Организацией экономического сотрудничества и развития (ОЭСР) в 2019 году, Россия участвовала в их разработке, но не присоединилась к ним. В 2020 году Центр Россия-ОЭСР РАНХиГС на основе этих рекомендаций разработал чек-лист для выявления правовых рисков, связанных с использованием компаниями систем ИИ», — рассказывает руководитель Российского центра компетенций и анализа стандартов ОЭСР РАНХиГС Антонина Левашенко.
Айгиз Кунафин отмечает, что пока запросов на создание подобных проектов от других народов России не поступало, но если такие появятся, его команда готова принять предложение.
«Есть два способа, как мы можем помочь. Мы покажем, как это можно сделать самим, и они могут повторить, используя какие-то наши наработки и опыт. И второй — наш проект начинает поддерживать другие языки», — отмечает господин Кунафин.
Опрошенные «Ъ-ИТ» эксперты считают, что для того, чтобы быть востребованной, «умная» колонка должна разговаривать на нескольких языках народов РФ.
«По данным Минобрнауки, в российской государственной системе образования используется 105 языков. По данным переписи 2020 г., более 30 млн человек считали родным один из языков народов России помимо русского. Однако таких языков, которые считали бы родными более 1 млн человек, в России всего три: татарский, чеченский и башкирский. Маловероятно, что проекты колонок для менее распространенных языков будут успешными, однако такими могут быть один или несколько голосовых помощников, обученных нескольким языкам народов РФ и, следовательно, охватывающих больше потенциальных пользователей, которым это может быть интересно», — отмечает Антонина Левашенко.
«Мы считаем, что будущее за подобными «умными» технологиями, которые помогают человеку стать образованнее, эрудированнее и которые делают жизнь человека легче и интереснее. Наша компания о создании «умной» колонки пока еще не задумывалась, но уже несколько лет работает над собственным голосовым помощником. Конкретно в нашей компании он помогает специалистам колл-центра и нашим абонентам, а в целом рассчитан на все виды бизнеса, которые так или иначе общаются с клиентами по телефону. Голосовой помощник Уфанет умеет анализировать речь — таким образом, звонящий может проговорить свой вопрос, а не нажимать на кнопки на клавиатуре телефона», — рассказывает руководитель PR-службы компании «Уфанет» Александра Крайнева.