Новая нейросеть от LG может создавать текстовые описания по изображениям

Корейская компания LG на конференции Computer Vision and Pattern Recognition 2023 в Канаде представила нейросеть Captioning AI, которая может создавать текстовые описания к картинкам. Разработчики отмечают, что ИИ может помочь в систематизации баз данных фотографий.

В компании считают свой продукт уникальным, так как он может описывать даже то, что никогда не видел, например опознать пейзаж или человека по фотографии. ИИ может сгенерировать текстовые описания к более чем 10 тыс. изображений менее чем за два дня. Система работает на созданной LG AI Research технологии Zero-Shot Image Captioning, позволяющей нейросети описывать сцены или объекты, опираясь на предыдущий опыт. Также ИИ может описывать фон, активность персонажей и взаимодействие элементов.

Евгений Федуненко

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...