Чем примечателен сенсационный чат-бот от китайского стартапа DeepSeek

Новый ИИ от китайского стартапа DeepSeek обрушил акции Nvidia и других технологических компаний. Что из себя представляет чат-бот и чем отличается от западных аналогов — в справке «Ъ».

Фото: Dado Ruvic / Illustration / File Photo / Reuters

Компания DeepSeek выпустила две языковые модели — бесплатную V3 и платную R1. Чат-бот начал стремительно набирать популярность, и к концу января приложение AI Assistant с DeepSeek-V3 вышло на первое место в списке самых популярных бесплатных приложений AppStore в США.

Владельцем стартапа является китайский миллиардер Лян Вэньфэн, работающий в хедж-фонде High-Flyer и сделавший себе состояние на торговле акциями,— он использовал алгоритмы ИИ для выявления закономерностей, влияющих на котировки.

В 2021 году бизнесмен закупил тысячи графических процессоров Nvidia, которые в октябре 2023 года попали под санкции США. В 2023 году господин Вэньфэн запустил DeepSeek и заявил, что хочет создать ИИ человеческого уровня.

После выхода чат-бота в компании сообщили, что стоимость разработки ИИ не превысила $6 млн (по данным аналитической фирмы Epoch AI, OpenAI потратила на обучение ChatGPT от $41 млн до $78 млн), а сами мультимодальные модели с почти 671 млрд параметров обучали на далеко не самых передовых графических процессорах Nvidia H800 — всего их было 2048.

Как утверждает сама китайская компания, ее модель R1 не уступает GPT-4o по ключевым показателям, а цена на ее использование на 96% дешевле, чем на передовую GPT-4o OpenAI.

Заявление DeepSeek о том, что она может создавать языковые модели не хуже западных конкурентов, но при этом в несколько раз дешевле, обрушило акции технологических компаний — одна только Nvidia потеряла в стоимости почти $600 млрд. На фоне успеха чат-бота DeepSeek президент США Дональд Трамп заявил о необходимости активизации усилий американских разработчиков в сфере ИИ.

Сама же DeepSeek тем временем выпустила семейство мультимодальных моделей искусственного интеллекта Janus Pro, которые, как заявляют в компании, способны анализировать и генерировать изображения лучше, чем DALL-E 3 от OpenAI. Есть версии Janus Pro с производительностью от 1 до 7 млрд параметров, однако пока что они могут генерировать картинки с разрешением не больше 384×384.

Евгений Федуненко

Вся лента