«Глубокий взгляд» на конкурентов

Почему китайская нейросеть DeepSeek стала IT-сенсацией

20 января 2025 года китайская компания DeepSeek («Глубокий взгляд») выпустила модели DeepSeek-R1-Zero и DeepSeek-R1. Последняя всего за один день сумела стать одним из самых популярных приложений в мире, обвалить акции Nvidia на $600 млрд и стать конкурентом ChatGPT. «Ъ-Review» разбирался, почему нейросеть DeepSeek стала IT-сенсацией, действительно ли она столь уникальна, как об этом заявляют ее разработчики, и какое будущее ждет китайские нейросети в России.

Фото: Dado Ruvic / Illustration / Reuters

Фото: Dado Ruvic / Illustration / Reuters

Нейросеть (большая языковая модель) DeepSeek, ставшая настоящей сенсацией в мире IT, проделала долгий путь к своей громкой премьере. Первые версии DeepSeek, разработанные одноименной лабораторией, финансируемой хедж-фондом High-Flyer, были выпущены еще в 2023 году и также имели значительный успех — но по факту остались незамеченными в большом IT-мире, поскольку были ориентированы на аудиторию Китая.

«Ситуация изменилась, когда в январе 2025 года разработчики выпустили DeepSeek-R1, основанную на модели V3, но со значительными улучшениями. По результатам различных тестов она находится на уровне самых передовых моделей, таких как o1 от OpenAI»,— объясняет ведущий эксперт отдела разработки и тестирования компании «Код безопасности» Александр Самсонов.

Более того, как оказалось, по сравнению с аналогами DeepSeek-R1 имеет ряд преимуществ, в том числе открытость и существенно более низкую стоимость использования в облаке по сравнению с конкурентами. Но главным преимуществом новинки из Китая, заявленным разработчиками, стало обучение модели на менее производительном оборудовании по сравнению с аналогами, которое в итоге обошлось значительно дешевле.

Важный момент заключается в том, что ранее США ввели санкции для технологического сдерживания Китая в области разработки искусственного интеллекта (ИИ) и запретили своим компаниям продавать в КНР самое мощное и продвинутое оборудование для обучения моделей, отмечает господин Самсонов. В частности, запрет касается Nvidia, которая, по сути, выступает монополистом в области производства самых мощных ускорителей, применяемых для обучения моделей ИИ. «В связи с этим стало большой неожиданностью, что Китай вообще смог создать настолько передовые модели, при этом показав, что их можно разрабатывать значительно дешевле»,— говорит собеседник «Ъ-Review».

Тени сомнений

Выход нейросети DeepSeek-R1 всколыхнул IT-сообщество и фондовые рынки, а многие мировые технологические компании понесли значительные потери в капитализации. Инвесторы усомнились в целесообразности многомиллиардных трат на разработку ИИ, если такая мощная модель, как DeepSeek, может быть создана с гораздо меньшими расходами. Однако довольно быстро эксперты выяснили, что у китайской нейросети есть и свои слабые стороны. «DeepSeek — хороший инструмент, но не идеальный, как это может показаться из публичного продвижения. Модель могли специально натренировать для прохождения тестов, что не гарантирует аналогичного качества на практике»,— объясняет инженер по информационной безопасности R-Vision Дмитрий Бурмашов.

В некоторых задачах DeepSeek-R1 действительно показывает впечатляющие результаты, говорит господин Бурмашов и в качестве примера приводит свой личный бенчмарк, с которым ранее справилась только o1. Теперь к ней присоединилась и DeepSeek, но с заметной разницей: если o1 потратила на рассуждения 50 секунд, то DeepSeek — 400. При этом китайская нейросеть — первая reasoning-модель, имеющая доступ к поиску и способная частично заменять поисковые системы.

Однако DeepSeek заметно слабее в гуманитарных вопросах по сравнению даже с ChatGPT-4o или Claude Sonnet 3.5, не являющимися reasoning-моделями, отмечает собеседник «Ъ-Review». Вероятно, разработчики сосредоточились на технических задачах, тогда как конкуренты из США использовали более разнообразную обучающую выборку.

Однако главный вопрос, связанный с DeepSeek-R1, состоит в том, как разработчики нейросети сумели создать реального конкурента ChatGPT, по официальным заявлениям потратив всего около $6 млн — в разы меньше, чем стоила разработка знаменитой модели ИИ от OpenAI.

По мнению директора направления Data Fusion «Лиги цифровой экономики» Александра Кобозева, теоретически создание более доступного аналога ChatGPT возможно путем оптимизации архитектуры: «Модели типа Mistral-7B или DeepSeek-MoE показывают, что меньшие по размеру сети с продуманной структурой могут достичь качества, сравнимого с GPT-3.5».

«Другое важное обстоятельство — доступность ресурсов. Китайские компании активно используют локальные облака (Alibaba Cloud и Tencent), а также доступные графические процессоры (например, Ascend от Huawei), что существенно снижает затраты на обучение»,— говорит господин Кобозев.

Наконец, не менее значима и государственная поддержка: субсидии на ИИ-разработки в Китае сокращают финансовую нагрузку на стартапы. Однако при создании нейросети DeepSeek-R1 мог сыграть свою роль и еще один фактор: сегодня крупные ИИ-разработчики подозревают своих китайских коллег в том, что те могли использовать их данные для обучения модели. Расследование этой версии продолжается.

«По мнению разработчиков Microsoft и OpenAI, создатели новой нейросети для повышения качества результатов работы могли применять данные популярных конкурентов, а затем использовать методы оптимизации и ускорения»,— говорит руководитель R&D-лаборатории Центра технологий кибербезопасности ГК «Солар» Максим Бузинов.

По мнению специалистов, у низкой стоимости разработки DeepSeek-R1 неизбежно есть своя обратная сторона. В частности, DeepSeek утверждает, что их модель в десять раз дешевле в эксплуатации, чем GPT-4, благодаря комбинации методов обучения и квантования весов, говорит господин Кобозев. Однако упрощение структуры модели может привести к потере универсальности, она будет хуже справляться с редкими запросами.

В свою очередь, господин Бузинов обращает внимание, что на сегодняшний день есть вопросы к безопасности данных внутри DeepSeek и реализации требований к доверенному ИИ. Энтузиасты уже находят уязвимости в инфраструктуре DeepSeek. В ближайшее время рынок будет с интересом наблюдать, как новый игрок будет с ними справляться, прогнозирует эксперт.

Ставка на нейросети

Китай активно развивает сферу искусственного интеллекта, и, судя по всему, этот процесс будет только ускоряться. Основные цели этой деятельности — создание конкурентоспособных товаров, улучшение экономического прогнозирования и повышение эффективности бизнеса. Согласно недавним исследованиям, за последний год количество активных разработок в области искусственного интеллекта в Китае выросло более чем на 30% и продолжает расти, говорит господин Кобозев.

«За долгое время такие гиганты, как Alibaba, Baidu и даже Tencent, не преуспели в создании собственного китайского ИИ. Поэтому появление High-Flyer с их DeepSeek — это настоящий прорыв для китайского рынка»,— считает руководитель группы защиты инфраструктурных IT-решений компании «Газинформсервис» Сергей Полунин.

Китай, как и США, скорее всего, сосредоточится на поддержке одной лидирующей компании в сфере ИИ, прогнозирует господин Бурмашов: «Однако в стране уже работает множество других компаний, разрабатывающих собственные большие языковые модели». Поэтому, продолжает он, число нейросетей будет расти, но главным образом — за счет естественных рыночных процессов.

При этом нейросеть от DeepSeek год назад фактически спровоцировала в Китае настоящее противостояние моделей ИИ, вынудив конкурентов, таких как ByteDance и Alibaba, снижать цены на свои продукты, в то же время пытаясь повысить свою прибыль, говорит директор IT-кампуса «Неймарк» Валерий Черепенников. В дальнейшем, уточняет он, это противостояние будет лишь нарастать, причем не только в Китае. «Появление моделей с открытым исходным кодом и весами простимулирует новые исследовательские проекты в разных странах, в том числе в России»,— говорит господин Черепенников.

Инструменты из Китая

Для российских пользователей и компаний важно, что модель DeepSeek доступна в России и может быть развернута локально внутри конкретной организации. По словам специалиста по информационной безопасности компании F.A.C.C.T. Николая Степанова, это существенно облегчает работу тем компаниям, которые используют искусственный интеллект, поскольку им больше не нужно искать обходные пути для оплаты, как, например, с ChatGPT.

«Перспективы DeepSeek и других китайских нейросетей в России выглядят весьма многообещающими. Отечественный рынок заинтересован в современных ИИ-инструментах, способных повысить эффективность различных секторов экономики»,— соглашается господин Кобозев.

По мнению собеседника «Ъ-Review», с ростом запроса на автоматизацию обработки больших данных DeepSeek может стать полезным инструментом для российских компаний, стремящихся повысить качество аналитики. В условиях нарастающей глобальной конкуренции такие перспективные разработки, как DeepSeek, будут востребованы в России, особенно в сферах, связанных с финансами и Big Data.

Спрос на китайские нейросети в России обусловлен несколькими факторами. Во-первых, в условиях санкций российский бизнес и госструктуры избирательно подходят к использованию зарубежного ПО из-за риска блокировок. Во-вторых, DeepSeek, обученную на мультиязычных данных, проще локализовать для русского языка, чем модели, ориентированные только на английский или китайский, объясняет господин Кобозев.

«В то же время существуют и препятствия. Так, нельзя игнорировать культурный барьер: многие китайские ИИ хуже понимают контекст русской речи по сравнению с местными разработками. К тому же на рынке довольно высокая конкуренция, ведущие российские IT-компании активно продвигают собственные NLP-модели»,— говорит собеседник «Ъ».

В ближайшем будущем китайские нейросети с большой долей вероятности займут свою нишу в корпоративном секторе (например, анализ данных для сырьевых компаний), но в массовом сегменте будут уступать российским продуктам, считает господин Кобозев. «Успех DeepSeek зависит от ее способности балансировать между качеством, ценой и некоторыми другими параметрами. В России такие инструменты найдут применение в B2B, но вряд ли заменят локальные аналоги»,— заключает он.

Этот текст — часть нового проекта ИД «Коммерсантъ», посвященного трендам бизнеса и финансового рынка. Еще больше лонгридов с анализом ключевых отраслей российской экономики, экспертных интервью и авторских колонок — на странице Review.

Павел Тихонов

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...