Американская корпорация Google представила нейросеть Imagen, которая генерирует фотореалистичные изображения из текстового описания. В компании утверждают, что их разработка лучше аналогичной нейросети DALL-E от OpenAI как по точности, так и по достоверности.
Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
25.05.2022 Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
25.05.2022 Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
Изображение, сгенерированное нейросетью Imagen
Фото: Google
Для генерации изображений нейросеть использует метод диффузии: сначала делается небольшой схематичный набросок, который дальше улучшается и увеличивается в разрешении до тех пор, пока не будет максимально соответствовать запросу. У нейросети получилось, например, сделать изображения с текстовым описанием «очень злая птица» или «изображение собаки корги на велосипеде на Таймс-сквер — на ней солнцезащитные очки и пляжная шляпа».
В ноябре 2021 года «Сбер» представил свою аналогичную нейросеть под названием ruDALL-E. Как заявляли авторы, система может использоваться для разработки дизайна интерьера, векторных иллюстраций, материалов для рекламы и создания стоковых картинок.
Еще больше новостей — в Telegram-канале «Коммерсантъ».
Евгений Федуненко