ИИзнанка

Александр Леви — о первой публикации системных подсказок в индустрии искусственного интеллекта

Обозреватель “Ъ FM” Александр Леви рассказывает о том, какие подробности работы чат-бота Claude стали известны.

Фото: Richard Drew / AP

Создатель чат-бота Claude — компания Anthropic — первой в отрасли опубликовала системные промты, работающие внутри ее моделей. В частности, именно эти подсказки определяют, что должны или не должны делать Claude 3 Opus, Claude 3.5 Sonnet и Claude 3.5 Haiku, а также задают общий тон ответов. Ни одна другая компания, занимающаяся разработкой инструментов искусственного интеллекта вроде OpenAI, Google, Mistral или запрещенная в России и признанная экстремистской Meta, никогда не публиковали подсказки своих систем. Мотивы веские и вместе с тем поверхностные: либо из соображений конкуренции, либо из опасений кибератак.

По раскрытым данным Anthropic, актуальным на 12 июля, подсказки системы запрещают всем трем моделям Claude открывать URL-адреса, прочие ссылки, видео. Кроме того, промты не разрешают идентифицировать или называть людей на изображениях. Есть также безобидное, на первый взгляд, ограничение вроде запрета на применение слов-паразитов, таких как «безусловно» или «абсолютно», например. В случаях, когда модели не могут ответить на вопрос, потому что информацию трудно отыскать, модели Claude, прямо как пацаны, не извиняются. В их системных промтах иной сценарий действия.

В ответ на сложный запрос пользователя ИИ предупреждает что, хотя он и старается точно ответить, у него могут быть галлюцинации. Отмечу, что база знаний Claude 3.5 Sonnet была обновлена в апреле 2024 года, в то время как версии Opus и Haiku получили апдейт в августе 2023-го. Это значит, что при идентичных системных подсказках, ответы моделей могут отличаться по фактуре.

Почти одновременно с публикацией промтов суммарная выручка Anthropic за мобильные версии Claude перешагнула отметку в $1 млн. Для достижения этого показателя потребовалось 16 недель. Это не самая стремительная динамика. Лидером в отрасли остается ChatGPT с результатом в три недели. В этом условном забеге продуктам Anthropic удалось обогнать Microsoft Copilot и Perplexity, которые добрались до выручки в $1 млн за 19 и 22 недели соответственно.

Чаще всего к моделям Claude обращаются в США, Индии и Японии. В России получить к ним доступ также просто, как и к ChatGPT.

Вся лента