GPT-4o заговорил на 50 языках

Чему научилась версия ИИ от OpenAI

ChatGPT научили распознавать эмоции и флиртовать: компания OpenAI представила новую версию искусственного интеллекта, которая получила название GPT-4o. Теперь он умеет работать со звуком и видео. Модель поддерживает 50 языков и может работать как переводчик, озвучивая реплики в реальном времени.

Фото: Игорь Иванко, Коммерсантъ

Фото: Игорь Иванко, Коммерсантъ

Кроме того, как заявляют разработчики, голос GPT-4o максимально близок к человеческому, он точно воспроизводит акцент, интонации и эмоции собеседника. “Ъ FM” решил это проверить и попросил произнести слоган радиостанции на пяти разных языках:

За использование модели GPT-4o компания не планирует взимать плату. Если у клиента уже есть подписка, сервис будет работать быстрее. Также пользователю будет доступно в пять раз больше запросов и несколько дополнительных функций. “Ъ FM” убедился, что даже бесплатная модель стала работать быстрее по сравнению с предыдущими версиями. Вот что ответила нейросеть на просьбу прокомментировать дело Дональда Трампа, которое сейчас слушается в суде Нью-Йорка:

На сайте компании OpenAI говорится, что новая модель умеет генерировать GIF-анимацию с 3D-моделями, рисовать логотипы и шрифты, а также представлять, как они могут выглядеть прямо на товарах. Главный архитектор искусственного интеллекта МИФИ Роман Душкин по просьбе “Ъ FM” изучил материалы для разработчиков и назвал GPT-4o качественным прорывом: «Как раньше можно было общаться голосом с GPT-4? Это был пайплайн, то есть некий конвейер. Сначала небольшая модель ИИ переводила ваш голос в текст, потом он передавался в GPT-4 или ChatGPT, и какая-то уже третья модель его озвучивала. Модель GPT-4o работает без этой конвейерной обработки данных. Она может писать, может говорить, то есть воспроизводить звуки, может выдавать видео.

Я считаю, что это серьезный прорыв в том числе и потому, что они существенно снизили количество потребляемых моделью токенов, допустим, для русского языка почти в полтора раза.

Это качественный рывок вперед и при этом снижение стоимости использования. Они уже открыли доступ, насколько я понял, своим доверенным экспертам. В ближайшее время эта модель будет интегрирована как в обычный ChatGPT, так и в GPT Plus».

OpenAI также представила приложение для Mac, в котором пользователи могут общаться с ChatGPT. Оно уже доступно подписчикам, в «ближайшие недели» его можно будет скачать бесплатно. Версия для Windows появится «позже в этом году».


С нами все ясно — Telegram-канал "Ъ FM".

Илья Сизов, Екатерина Вихарева

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...