«Сейчас заказчики активно пробуют эти технологии „на вкус”»

Интервью

В 2014 году на конференции LeWeb в Париже «Яндекс» объявил о создании Yandex Data Factory — международном направлении для решения бизнес-задач компаний, которые имеют дело с большими массивами данных. Исполнительный директор Yandex Data Factory Александр Хайтин на «Иннопроме-2016» — участник панельной дискуссии «Промышленный интернет вещей и большие данные в российской промышленности: эволюция или революция?». В интервью он рассказал о тенденциях в сфере обработки больших данных (Big Data).

— Чем занимается Yandex Data Factory сегодня?

— Технологии «Яндекса» — машинное обучение, распознавание образов и речи, глубокие нейронные сети, обработка естественного языка — позволяют проанализировать эти данные и получить решение задачи. Помимо технологий, необходимых для обработки «больших данных», «Яндекс» располагает сильнейшими экспертами в этой области. Yandex Data Factory создает и предоставляет заказчикам разного рода предсказательные и рекомендательные сервисы, основанные на технологиях машинного обучения. Они призваны решать конкретную бизнес-задачу клиента и позволяют получить измеримый экономический эффект за счет сокращения затрат или увеличения объема продаж.

Часть предоставляемых сервисов ориентирована на поведенческую аналитику. В этой области решаются задачи предсказания оттока, рекомендательные системы, предлагающие потребителям товары или услуги с учетом вероятности их приобретения. Есть решения по предсказанию спроса, по оптимизации производства. Например, рекомендательная система по использованию ферросплавов при производстве стали. Отдельно можно выделить решения в области компьютерного зрения.

Весной Yandex Data Factory разработала сервис автоматической модерации изображений. Он может быть полезен компаниям, которые тратят много ресурсов на модерацию контента, загружаемого пользователями: социальным сетям, сервисам знакомств, сайтам объявлений, маркетплейсам.

— Каковы финансовые результаты внедрения решений Yandex Data Factory для клиентов?

— Когда мы говорим об оптимизации, не стоит ожидать поражающих воображение улучшений. Большая часть простых решений уже принята, поэтому для нас хороший результат это улучшение какого-либо показателя (продажи, экономия материалов) от 2-3% до 10%. Для бизнеса с большим оборотом такое улучшение превращается в существенные деньги. Особняком стоят сервисы, напрямую автоматизирующие тот или иной процесс (в частности автомодерация), тут экономия может быть значительной и составлять десятки процентов от текущих затрат. Некоторые решения открывают для заказчиков принципиально новые возможности. Примером такого решения может быть сервис для ЦБ, который позволяет решать задачи, ранее невыполнимые. В феврале 2016 года аналитики Yandex Data Factory построили для Центробанка специализированную модель поиска сайтов организаций, предлагающих потребительские займы. Она находит релевантные страницы из миллиардов, хранящихся в поисковом индексе «Яндекса», и с помощью технологии машинного обучения «Матрикснет» оценивает их вероятный юридический статус.

— Для каких отраслей в первую очередь полезны такие продукты и решения?

— Для разных заказчиков — разные сервисы. Когда мы говорим об оптимизации, необходимыми предпосылками успеха являются наличие достаточных данных и существенный оборот. Без данных невозможно оптимизировать, а при малом обороте оптимизация не дает существенного эффекта. Машинное обучение может быть применено к разным отраслям.

— Каковы тенденции в сфере интернета вещей?

— Технологии сейчас быстро развиваются. Многие события проходят незамеченными. Например, мало кто задумывается о том, что подбор контента в Facebook производится автоматически при ограниченном контроле со стороны пользователя. Также привычным стало использование автомобильной навигации, включающей прогноз пробок. Поскольку новые технологии затрагивают практически все области бизнеса и промышленности, выбор наиболее ярких примеров чаще всего идет в пользу наиболее простых, доступных как авторам, так и читателям, без необходимости вникнуть в проблему. Следствием этого становятся слишком сильные упрощения.

По нашим оценкам, сейчас пройден первый «разговорный» этап, когда преобладало стремление узнать и понять новые технологии, но до практического их применения дело доходило редко. Сейчас заказчики активно пробуют эти технологии «на вкус», ведут разного рода пилотные и экспериментальные проекты. Вероятно, следующим этапом будет массовое промышленное применение технологий.

Беседовал Алексей Охлопков

Реализуемые проекты Yandex Data Factory (YDF)

В августе 2015 года YDF анонсировали подписание соглашения о построении математической модели плавки стали в кислородно-конвертерном цехе (ККЦ) Магнитогорского металлургического комбината.

В ноябре 2015 года Yandex Data Factory, фармацевтическая компания «Астразенека» и Российское общество клинической онкологии RUSSCO запустили платформу RAY для обработки и хранения данных геномного секвенирования. Она предназначена для генетиков и молекулярных биологов. Платформа поможет улучшить методы диагностики рака и выявления предрасположенности к онкологическим заболеваниям.

В ноябре 2015 года Yandex Data Factory договорилась о стратегическом партнерстве, в рамках которого планируется создать сервисы, позволяющие спрогнозировать отток клиентов, выявить абонентов с потребностью в мобильном интернете, повысить эффективность работы специалистов по продажам в колл-центрах и оптимизировать затраты на рекламу за счет ее персонализации.

По заказу Федерального дорожного агентства Yandex Data Factory разработала систему прогнозирования заторов и ДТП. Система предсказывает ситуацию на дорогах, показывает прогноз на интерактивной карте и обновляет его в реальном времени.

Разработчики и аналитики Yandex Data Factory научились предсказывать, какое количество игроков World of Tanks с большой степенью вероятности могут оставить игру. Для решения были использованы данные о 100 тыс. случайных пользователей, включающие более 100 параметров (информация о покупках, играх, количеству и типу боев в играх, количество уничтоженных вражеских танков, опыт и других). Прогноз, построенный с помощью технологии машинного обучения «Матрикснет», оказался на 20–30% точнее привычных инструментов анализа, которые используют в игровой индустрии. World of Tanks от Wargaming имеет 100 млн зарегистрированных игроков во всем мире.

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...