Нейросеть Ferret от Apple обучили принимать в качестве запросов изображения

Американская корпорация Apple выпустила мультимодальную языковую модель Ferret, которая работает как с текстами, так и с изображениями. Выход нейросети не сопровождался анонсами от компании, однако она привлекла внимание специалистов по искусственному интеллекту.

Фото: Александр Коряков, Коммерсантъ

Нейросеть анализирует изображение и определяет, какие на нем находятся предметы, после чего очерчивает их рамками. Ferret считает части картинки запросом, а ответ предоставляется в текстовой форме. Пользователи могут, например, попросить нейросеть распознать животное на фотографии, после чего она предоставит развернутый ответ и уточнит информацию по другим действиям или объектам. Ferret является нейросетью открытого формата — вероятно потому, что Apple не захотела выпускать коммерческого конкурента ChatGPT.

Ранее Apple выпустила обновление операционной системы iOS 17.2, которое исправило ряд ошибок, а также добавило поддержку пространственной видеосъемки для гарнитуры Vision Pro и приложение «Дневник». Также компания тестирует новую функцию, благодаря которой можно будет получить скидки на новые подписки при условии, что пользователь уже подписан на одну из них.

Евгений Федуненко

Вся лента