Screenlife Technologies Тимура Бекмамбетова и разработчик HR-сервиса «Робот Вера» Stafory запустили проект Vera Voice, который позволяет синтезировать голоса знаменитостей на русском языке. Технология работает на нейросети, которая производит анализ голоса и выдает его оцифрованную копию. Сервис планируется использовать для озвучки игр, книг, фильмов, рекламы и других проектов.
«Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса, и оцифрованного текста, который он зачитывает,— заявляет сооснователь Stafory Владимира Свешникова.— Аудиопоток и текст выгружаются в несколько нейронных сетей одновременно, одна генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук».
С обладателями голосов будут заключать договоры, первый проект обещают запустить в течение месяца — сооснователь студии «Кубик в кубе» Руслан Габидуллин уже согласился предоставить свой голос для записи интерактивной рекламы, голосовых открыток, аудиокниг и игр. Переговоры идут также с агентством аудиокоммуникаций Unisound.
Представители компаний обещают, что будут защищать интересы обладателей голосов и бороться с фейками. По словам Тимура Бекмамбетова, «отлавливать подделки и защищать известных людей от несанкционированного копирования их образов — одна из главных задач» проекта.