Искусственному интеллекту снижают планку
в части затрат на его обучение
В США разработали аналог DeepSeek всего за $30, по крайней мере, так утверждают СМИ. Компания OpenAI, лидер среди генеративных нейросетей, потратила более $100 млн на обучение своей модели. Ее новый конкурент — китайский DeepSeek — выпустил гораздо более дешевый и, по заявлениям создателей, такой же мощный искусственный интеллект за $6 млн. Команда ученых из Калифорнийского университета в Беркли утверждает, что их бюджет оказался в 200 тыс. раз меньше. Разработчики надеются, что обучение моделей со временем станет доступнее.
Фото: Игорь Иванко, Коммерсантъ
Фото: Игорь Иванко, Коммерсантъ
Некоторые решения действительно просто и недорого воспроизвести, считает руководитель образовательной программы «Искусственный интеллект» МИФИ Роман Душкин. Но о революции, по его словам, пока речи не идет: «Стоит ожидать, что каждый деревенский дурачок начнет кричать, что у него есть своя нейросеточка за какие-то копейки. Здесь речь идет либо об архитектурном конструировании из имеющихся моделей какой-то системы более высокого порядка, когда младшие модели, образно говоря, GPT-4 Omni, общаются друг с другом, либо взяли какую-то программу типа той же DeepSeek-R1-Zero и обучили ее чисто для решения двух задач. Воспроизвести процесс рассуждений на младших моделях фактически сейчас способен студент-четверокурсник».
Успешный выпуск модели DeepSeek обрушил капитализацию крупнейших технологических компаний из-за сомнений инвесторов в целесообразности крупных вложений. Например, американский производитель чипов Nvidia за один день потерял $600 млрд. Впрочем, эксперты утверждали, что низкая стоимость разработки китайского стартапа может сказаться на качестве модели и со временем вскроются ее недочеты. IT-специалист Александр Баулин объяснил, за счет чего можно снизить расходы на обучение моделей искусственного интеллекта:
«Если мы сокращаем выборку, на которой обучаем систему, то стоимость обучения снижается, то есть уменьшаем количество тем, по которым она сможет с нами говорить, и количество слов, которое она будет понимать в предложениях. И это будет стоить дешевле. Не скажу точно про $30, но вопрос цены сильно зависит от того, насколько модель будет интеллектуальной. Я бы к с осторожностью относился к заявлениям производителей относительно затрат. При этом, надеюсь, такая гонка среди компаний обрушит не ценность, а именно стоимость обучения искусственного интеллекта. Если раньше все равнялись на OpenAI и ее модели, то теперь видно, что можно сделать достойные конкурентные продукты по меньшим расценкам.
Практически запущена модель конкуренции, шире круг игроков, которые могут попробовать обучить свой ИИ. Они между собой выявляют лучшую модель, а в результате выигрывает пользователь.
Что касается идеи об объединении разработчиков для создания одного проекта, то это называется универсальный искусственный интеллект, который сможет и в картинки, и в тексты, и самое главное — его не надо будет каждый раз переобучать, он сможет сам понимать задачу и под нее обучаться. Это голубая мечта исследователей ИИ. Потому что, если это получится, мы практически получим искусственный разум. Если мы говорим про обычную нейросеть, про обучение модели, то какие-то компании могут объединяться и какие-то альянсы возможны. Но не верю, что на рынке останется одна большая модель».
Помимо чат-бота DeepSeek, одноименный китайский стартап запустил и собственный генератор изображений. По заявлениям разработчиков, его алгоритмы справляются с задачами лучше, чем американский аналог Dalle-3. Также технологическая компания Alibaba вывела на рынок свой продукт, заявив, что он превосходит конкурентов в КНР и США. А ByteDance, которой принадлежит TikTok, 4 февраля запустила свою модель, которая может генерировать видео с изображением людей из фото и аудио.
С нами все ясно — Telegram-канал "Ъ FM".