«К преимуществам NeMo можно отнести сильные многоязыковые возможности»
Александр Леви — о языковой модели Mistral и Nvidia
Обозреватель “Ъ FM” Александр Леви рассказывает о модели с открытым исходным кодом от французской корпорации и ее отличиях от GPT-4o mini.
Фото: Ann Wang / Reuters
Французский стартап в сфере искусственного интеллекта Mistral в сотрудничестве с Nvidia выпустил новую легкую языковую модель с открытым исходным кодом Mistral NeMo. У нее есть все предпосылки, для того чтобы стать серьезным конкурентом недавно выпущенной GPT-4o mini компании OpenAI. Новинка столь же эффективна с точки зрения потребления ресурсов. Ей нужно меньше аппаратных мощностей для работы в сравнении с большими языковыми моделями, что снижает затраты на инфраструктуру при развертывании.
Стандартный отраслевой бенчмарк MMLU (Massive Multitask Language Understanding) NeMo прошел с хорошим результатом. Французская модель набрала 68% за способность решать проблемы и работу с общими знаниями. Между тем последний релиз OpenAI проявил себя лучше. В том же бенчмарке GPT-4o mini заработала 82%. К преимуществам NeMo можно отнести сильные многоязыковые возможности. Так как его обучение проводилось более чем на 100 языках, модель отлично себя показывает в английском, французском, немецком, испанском, итальянском, португальском, китайском, японском, корейском, арабском и хинди.
Между тем OpenAI ищет дополнительные пути усиления своего бизнеса, в частности, вендор изучает возможности разработки собственных чипов ИИ. Решение позволит снизить зависимость от гегемона Nvidia и одновременно укрепить собственные поставки. Генеральный директор OpenAI Сэм Альтман ведет переговоры с компанией Broadcom. Параллельно идет наем бывших сотрудников Google, имеющих опыт в аппаратной части инструментов искусственного интеллекта. Эти специалисты, конечно, не совершат чуда и не создадут завтра новый ИИ-чип. Но время разработки могут заметно сократить. Планы у OpenAI самые серьезные. Напомню, еще в начале года сообщалось, что Альтман планирует привлечь $7 трлн для создания вместе с Intel, TSMC и Samsung Electronics сети фабрик по производству чипов ИИ.