Волшебник страны o3
Александр Леви — о новой модели искусственного интеллекта от Open AI
Обозреватель “Ъ FM” Александр Леви рассказывает о возможностях и особенностях нейросети.
Фото: Игорь Иванко, Коммерсантъ
OpenAI представила новое семейство так называемых рассуждающих моделей искусственного интеллекта — o3 и o3 mini. Это наследники версии o1, выпущенной в сентябре этого года. Перепрыгнуть в индексе через цифру было решено во избежание путаницы. Создатели нейросетевой модели не хотят ассоциации с телекоммуникационной компанией из Великобритании — O2.
По сообщению создателей, в новых моделях улучшена способность к рассуждению и самопроверке. Это позволяет им избегать типичных ошибок ИИ. Для решения проблем безопасности разработчики применяют новую технику обучения — deliberative alignment или дословно «совещательное согласование». Среди принципов этого метода, например, обучение явным правилам безопасности на этапе тренировки. Они обязательно учитываются при ответе. Для этого, в свою очередь, применяется так называемая цепочка рассуждений. Также постоянно идет сбор примеров, связанных с безопасностью, их оценка и дальнейшее обучение на лучших образцах.
Кроме того, свежее семейство моделей от Open AI заметно превосходит версию o1 в возможностях программирования, отметили в компании. В стандартных отраслевых тестах по кодированию ее результат оказался почти на 23% выше. А в соревновательном программировании она даже превзошла главного научного сотрудника OpenAI. Вдобавок o3 продемонстрировала выдающиеся результаты в математике. Она набрала почти 97% баллов на Американском математическом конкурсе и решила свыше 25% задач в тесте EpochAI Frontier Math. Для сравнения — обычно ИИ модели не справляются даже с 2% задач этого теста.
Новое семейство ИИ будет доступно в трех режимах рассуждения: low, medium и high. Чем больше времени модель будет тратить на обработку задачи, тем точнее результат. В низком режиме модель покажет скорость сравнимую с возможностями GPT-4o, привели пример разработчики. Ожидается, что o3 mini станет доступна для тестирования в конце января наступающего года. Полная версия ИИ выйдет позже.