Nvidia анонсировала ИИ-модель Fugatto с генерацией и изменением звука

Компания Nvidia представила экспериментальную звуковую модель Fugatto, которая с помощью текстовых запросов может генерировать новые или изменять уже существующие звуковые файлы. В компании считают, что создали модель, которая «понимает и генерирует звук так, как люди».

ИИ-модель Fugatto, по замыслу авторов, может пригодиться музыкальным продюсерам для быстрого создания прототипа песни с возможностью редактуры и разными стилями голоса и инструментов. Также она поможет разработчиками видеоигр в создании вариаций уже записанных звуков для соответствия изменениям в играх на основе действий и выбора игроков.

При желании Fugatto можно настроить таким образом, чтобы она могла генерировать речь с интонациями или акцентом, а также изменяющиеся со временем звуки, например шум удаляющегося поезда или приближающегося дождя.

Подробнее о российских разработках в области искусственного интеллекта — в публикации «Ъ» «Нейросети открыты для предложений»

Евгений Федуненко

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...