"Искусственный интеллект пригодится в любой индустрии, в которой уже используются инструменты Big data"
мнение эксперта
NVIDIA за пять лет из производителя графических чипсетов превратилась в одного из лидеров рынка глубокого обучения (Deep learning), создав вокруг технологий искусственного интеллекта экосистему. МАРК ХАМИЛЬТОН — вице-президент по архитектуре, решениям и инженерным разработкам в NVIDIA. Его команда регулярно общается с заказчиками, помогает им начать ИИ в бизнесе.
— Вы много общаетесь с клиентами? Кто ваши основные заказчики теперь, после того как стратегия компании изменилась?
— Я провожу примерно половину своего рабочего времени за общением с клиентами, вторая половина занята работой с командой инженеров. Наши заказчики — это представители различных отраслей. В первую очередь из игровой индустрии. Но с ними я не работаю. Моя зона ответственности — крупный бизнес. Эту группу клиентов мы делим на несколько сегментов. Первая — это компании, профессионально работающие в сфере инженерного проектирования, дизайна и визуальных проектов. К примеру, это команды, разрабатывающие дизайн будущих автомобилей, самолетных двигателей, создатели анимационных фильмов. Второй сегмент — из сферы дата-центров: это компании, разрабатывающие высокопроизводительные компьютерные системы, а также те, что строят облачные платформы на базе искусственного интеллекта. Третий тип клиентов — это производители автомобилей. Они начинали использовать наши продукты сначала для дизайна машин, теперь все чаще для решения задач, связанных с созданием автономных автомобилей.
— Ваши "исторические" клиенты — это те, кто работает в игровой индустрии и в области визуального проектирования. Все другие компании стали покупать ваши продукты только в последнее время, не так ли? Похоже, что новые клиентские группы появились у вас в связи с распространением технологий искусственного интеллекта и машинного обучения.
— Давайте посмотрим, кто использует ИИ. Эти технологии разрабатываются последние 40-50 лет, но до последнего времени их невозможно было применять в индустриальных решениях. Три ключевых фактора сделали ИИ доступным бизнесу за последние пять лет. Во-первых, конечно же, алгоритмы и программы, которые существуют уже десятилетия, были доработаны. Во-вторых, появилось решение, которое эту математическую базу позволило перенести в машины. Раньше все эти алгоритмы не могли использоваться, потому что традиционные базы данных при наполнении больших количеством информации просто переставали работать. Но с ИИ дело обстоит так, что чем больше данных анализируешь, тем лучше результат. К примеру, невозможно понять, что предпочитают покупать мужчины, которым за 50 лет, живущие в Калифорнии, если в базе данных таких всего два человека. Поведенческие паттерны можно выявить, если есть, скажем, миллион записей для анализа. То есть три вещи должны сойтись, чтобы эти методы применять с пользой: алгоритмы, большое количество данных, вычислительные мощности, достаточные для их анализа.
Искусственный интеллект, по сути, произведение большого количества сложных математических операций на каждом из кусочков этих данных. Для такой задачи графический процессор (GPU) работает как акселератор в паре с центральным процессором (CPU). Такая комбинация позволяет прекрасно распараллелить вычисления. Именно по этой причине дизайнеры используют самые мощные графические карты, потому что в дизайне и проектировании также выполняется множество сложных математических вычислений.
— NVIDIA всегда славилась своими графическими картами. Гики и геймеры копили деньги на них. А сейчас вы фактически повернули бизнес в новом направлении и построили стратегию на ИИ, создали экосистему, причем довольно быстро. Даже открыли Deep Learning Institute в прошлом году. Как это все так стремительно произошло?
— Перелом в развитии ИИ произошел в 2012 году. Случилось два события. Во-первых, конкурс технологий компьютерного зрения, на котором впервые команда Университета Торонто под руководством Джеффри Хинтона отказалась от использования классического алгоритма "если-то" и использовала сеть машинного обучения, которую запустила на двух графических процессорах NVIDIA для игр. Они не просто победили в конкурсе, в котором было необходимо научить машину распознавать, что на картинке — машина или человек. Они повысили точность с 75% (лучший результат предыдущего года) до 85%. То есть победили с большим отрывом. В том же 2012 году профессор Эндрю Энджи из Стэнфорда сделал то же самое. Он сейчас работает в проекте Google Brain. В то время он изучал нейронные цепи и начал запускать их на GPU. Задача была распознать образы в видеозаписи. Четыре месяца спустя Google купила его стартап. Мы стали получать сотни запросов в месяц от академического сообщества, которое подбирало оборудование под гранты для профессоров. Мы вдруг поняли, что с того момента, как Джеффри Хинтон победил в ImageNet, то есть за три месяца, 70% запросов на гранты от профессоров касалось получения GPU для машинного обучения. Дженсен Хуанг, наш генеральный директор, который очень заботится обо всех наших образовательных проектах, подумал: "Что еще мы можем сделать для этих профессоров, помимо отправки им GPU? Как помочь им использовать наш продукт с большей эффективностью?" В итоге мы выпустили специальные продукты для машинного обучения — на базе архитектуры Maxwell два года назад, затем на архитектуре Pascal и в этом году на Volta, в которой есть специализированные вычислительные ядра для работы с нейросетями и задачами Deep Learning. Каждый год добавляем что-то новое в них.
До того как начали использоваться GPU, нужно было потратить месяц, чтобы обучить модель. А чтобы натренировать новую модель как следует, может понадобиться 50-100 таких попыток обучения. Даже аспиранты не тратят больше 100 месяцев на то, чтобы защитить кандидатскую работу. Вообще, мало кто может потратить столько времени на одну задачу. Джеффри Хинтон показал, что можно обучить алгоритм всего за два дня, 100 раз по два дня — это меньше года.
Теперь даже стартапы могут все это делать — собрать свой сервер, скачать TensorFlow (открытая библиотека для глубинного машинного обучения), установить эту платформу на операционную систему Ubuntu. Мы стремимся к тому, чтобы для разработки софта больше ничего и не нужно было — только установить TensorFlow. Для студентов и гиков это отличный вариант. Но когда мы приходим к крупному бизнесу, который использует продукты SAP и VMware, к таким компаниям, как Bank of America или Deutsche Telekom, мы не можем сказать — просто скачайте TensorFlow и прочитайте 360 страниц инструкций по его установке. Для них это слишком сложно. Вот поэтому мы создали DGX-1. Крупным компаниям этот вариант подходит больше — купить готовый сервер с уже встроенными программными продуктами для разработки.
— В каких отраслях нужен ИИ? На какой стадии освоения этих технологий находятся компании?
— Искусственный интеллект пригодится в любой индустрии, в которой уже используются инструменты Big data. Это, например, топ-500 компаний по версии журнала Fortune. Некоторые могут думать, что ИИ нужен только Facebook или Google. На самом деле любая компания может получить пользу от этих технологий. Счета, различные данные, базы клиентов, записи разговоров колл-центров, видеоархивы с камер безопасности — все это большие данные. Большая часть из них сейчас никак не используется.
В каждой индустрии, с которой мы работаем, мы видим так называемых early adopters — компании, которые первыми осваивают технологии. Они работают в области медицины, финансов, науки об образе жизни, нефтегазе. Покупают DGX-1, тренируют алгоритмы на своих наборах данных. Помимо них есть множество компаний, которые хотели бы, чтобы другие сделали за них работу. К примеру, это может быть наш партнер компания SAP, которая включила в набор продуктов средства для глубинного обучения. NVIDIA давно использует SAP для финансового учета и управления производством. Наши данные находятся в этих системах.
У SAP есть видение, что большая часть ее клиентов — примерно 80% — это late adopters. То есть это компании, которые не хотят сами разрабатывать алгоритмы глубинного обучения. Им проще перейти на новую версию SAP, в которую они уже встроены. Им понадобятся для этого GPU — либо из облака, либо в собственной инфраструктуре. К примеру, такое комплексное решение может сканировать резюме и соотносить их с теми вакансиями, которые есть у компании. Алгоритм глубинного обучения не просто ищет подходящие ключевые слова, но подбирает также людей по опыту работы в похожих сферах и так далее.
SAP стала одним из наших первых клиентов в Европе, который купил DGX-1. Им он понравился по двум причинам: половина их инженеров не знала Tensorflow, и для них это был простой способ освоить платформу. Затем в SAP поняли, что их 350 тыс. клиентов также могут нуждаться в таких инструментах. Когда мы встретились с вице-президентом SAP, который сейчас ведет этот проект, примерно полтора года назад, они только начинали этим заниматься. И он сказал: "Знаешь, Марк, наши клиенты используют очень разное оборудование, некоторые все еще работают с SAP на серверах Sun. Если мы выпустим версию, которая потребует использования GPU, как они смогут работать с ней на серверах Sun Sparc?"
Мы решили этот вопрос просто. Мы предлагаем купить новую версию SAP с поддержкой глубинного обучения и поставить в корпоративной сети DGX-1. Все будет работать в облаке SAP или в облаке NVIDIA. Так что мы упростили возможность использования глубинного обучения в корпоративных системах на уровне "железа". Я уверен, что это в ближайшие годы ускорит дальнейшее проникновение технологий в корпоративной среде.
— Есть одно препятствие, которое замедляет распространение ИИ. Оно касается регулирования. Компании не могут объяснить, как алгоритмы делают те или иные выводы, и не смогут ответить на вопросы контролирующих органов. К примеру, почему один клиент получил ставку по кредиту выше, чем другой. Что с этим можно сделать?
— NVIDIA не занимается регулированием и не устанавливает правила — это делает множество государственных организаций и агентств. Мы стараемся не волноваться о том, что не можем контролировать. Но вы правы в том, что традиционные нейронные сети работают как черный ящик. Это, с одной стороны, делает их сильным инструментом: нет необходимости понимать, как они работают. С другой — всегда есть определенная точность и доля погрешности. Обычно об этом говорят при обсуждении автономных автомобилей. Сегодняшние регуляторные правила требуют, чтобы производители объясняли, почему машина работает тем или иным образом. В этой сфере также замешаны страховые компании. Каждый день в автомобильных авариях в США погибают 125 человек. Если бы ежедневно падали самолеты United Airlines и 125 человек погибали, то никто бы не стал летать вообще. Если автономные автомобили будут на самом деле намного безопаснее, то страховые компании постараются помочь их распространению. Точно так же, как когда-то обязательными стали подушки безопасности и ремни. Процессы, которые происходят в этом черном ящике, пока предмет исследований. Сможем ли мы решить этот вопрос так, как хотят регуляторы, пока неизвестно. Я не могу сказать, появится ли решение в течение ближайших двух лет или позже. Но мы не считаем, что это замедляет скорость освоения этих технологий. Все еще есть множество областей, в которых ИИ может применяться и без понимания того, как алгоритмы делают выводы.
Кадровый вопрос
Дефицит специалистов в области Big data не уменьшается. В LinkedIn по этому направлению можно найти десятки тысяч вакансий: компании ищут ученых, аналитиков, инженеров, специализирующихся на больших данных. NVIDIA, чтобы решить эту проблему хотя бы частично, поступила кардинально: открыла два года назад Deep Learning Institute — Институт глубокого обучения. В прошлому году его окончили 10 тыс. специалистов. В нынешнем году их будет уже в десять раз больше — 100 тыс. разработчиков. Институт предлагает программу практического использования технологий искусственного интеллекта. Студенты могут выбрать специализацию: автономные автомобили, робототехника, умные города, медицина.