GigaChat будет обучен удмуртскому языку
Искусственный интеллект поможет сохранить национальные языки народов России
В России 150 национальных языков, некоторые из которых находятся на грани исчезновения. Чтобы их сохранить, помогут технологии искусственного интеллекта. Нейросетевая модель GigaChat начнет обучаться удмуртскому языку. Соглашение о сотрудничестве в этой сфере заключили Сбер и Министерство национальной политики Удмуртской Республики. Документ был подписан в День удмуртского языка, который отмечается 27 ноября.
Фото: Игорь Иванко, Коммерсантъ
Для обучения модели регион предоставит разработчикам тексты на удмуртском языке с переводом на русский. Это будут книги, статьи, научно-образовательные публикации, посты из соцсетей и другие материалы. Чтобы искусственный интеллект «заговорил» на удмуртском, стороны будут работать с носителями языка и дополнят данные актуальной информацией и диалогами. Затем тексты пройдут проверку на ошибки и станут основой для машинного обучения.
«Важно сохранить национальные языки народов России и передать их следующим поколениям. У Сбера для этого есть проверенные решения, которыми мы готовы делиться с нашими региональными партнерами. Примеров, когда AI-технологии помогли воссоздать утраченное и сохранить культурное наследие, много. С помощью искусственного интеллекта мы занимались распознаванием рукописей Петра I и расшифровкой древних египетских манускриптов. Теперь GigaChat займется изучением разных языков нашей большой страны. Подписанное соглашение с руководством Удмуртии поможет обучить модель удмуртскому. У этого уникального национального языка начинается новый, цифровой этап эволюции»,— сказал вице-президент, директор Департамента развития искусственного интеллекта и машинного обучения Сбербанка Максим Еременко.
«Сохранение и развитие языков народов РФ — основной вопрос Стратегии государственной национальной политики нашей страны. В Удмуртии для сохранения национального языка приняты региональные нормативные правовые акты. В том числе госпрограмма, которая утверждена постановлением правительства Удмуртии от 20.11.2023 №748. В ее рамках оказывается поддержка и развитие национальных СМИ, издается художественная, учебная и научная литература на национальном языке. Также ведется активная работа по оцифровке удмуртского языка. Создание и обработка корпусов текстов, на которых впоследствии можно обучить модели искусственного интеллекта, важный и нужный процесс. Он поможет в дальнейшем не только переводить, но и генерировать тексты на удмуртском языке. Что особенно важно в эпоху цифровизации»,— отметила постоянный представитель главы Удмуртии при президенте России — заместитель председателя правительства Удмуртии Дарья Сунцова.