Навигатор в море данных
Как в России развивается сегмент Big Data
В поисках знаний, дающих конкурентное преимущество, компании инвестируют в инструменты для хранения и анализа больших данных. Аналитики IDC считают Big Data одной из десяти главных технологий 2015 года. Российские компании с некоторым запозданием подхватывают тренд.
Многие специалисты считают Big Data очередным маркетинговым приемом. Но с реальностью не поспоришь: объемы данных стремительно растут (по сообщениям аналитиков, за последний год было создано 90% всей информации на земле). Эти данные могут и должны быть полезны для бизнеса. И бизнес это понимает: в прошлом году единственным типом корпоративного "железа", продажи которого не упали в России, оказались системы хранения данных (СХД). Большинству частных компаний уже очевидно, что информация об их клиентах может приносить существенную пользу, служить конкурентным преимуществом и дать возможность серьезно продвинуться вперед на рынке.
Однако большой ценности "большие данные", которые лежат мертвым грузом, не имеют. Чтобы они начали работать на бизнес, требуется применить специальные инструменты.
Компания Facebook использует продукт HP Vertica для анализа огромных массивов данных, которые ежесекундно создают сами пользователи и фиксирование их действий в информационных системах. Объем "больших данных" этой соцсети насчитывает более десятка петабайт. Система Vertica нужна не только для "утилизации" и хранения записей, но и для их анализа. Пока Facebook не начал использовать Vertica, аналитики могли изучать данные всего за 30 дней. Сейчас — за год. Это значит, что можно получить гораздо больше отзывов об эффективности рекламных кампаний, спрогнозировать поведение пользователей, дать более точные рекомендации по настройке маркетинговых кампаний. То есть теперь можно решать задачи из области "сложной аналитики", к примеру оценить эффективность кобрендинга в определенной возрастной категории потребителей продукта, пользующихся Facebook с мобильных устройств.
"При работе с большими данными наблюдается прямая закономерность: чем больше объемы, доступные для обработки, тем точнее и ценнее результат",— говорит Евгений Степанов, руководитель "HP Vertica Россия".
В системах традиционной архитектуры обработать огромные объемы накопленных данных было невозможно: не хватало ресурсов, и наращивание инфраструктуры проблему не решало: ограничения установлены в самих системах. Vertica масштабируется линейно: становится более производительной при добавлении дополнительного стандартного сервера. Теперь громадные объемы данных обрабатываются и приносят пользу.
Самое очевидное преимущество, которое дают такие инструменты,— рост скорости получения управленческой отчетности. Раньше данные по торговой сети собирались в сводный отчет в течение четырех часов раз в сутки, а с переходом на Vertica стало возможно получать сводки в любой момент за пять минут по всем магазинам России. Это позволяет принимать управленческие решения именно в тот момент, когда они необходимы, рассказывает Степанов.
Активнее всех с Big Data работают компании из финансового сектора, ритейлеры и мобильные операторы. Теперь они могут делать то, что раньше казалось фантастикой. Один из крупнейших международных банков использует Vertica для мгновенного онлайн-скоринга. К примеру, в магазине электроники покупатель помещает банковскую карту в банкомат. Система тут же анализирует данные об этом человеке и предлагает два варианта: оплатить покупку целиком или в рассрочку, причем условия по кредиту разработаны именно для него.
Равнение на инвесторов
Компании, которые обрабатывают "большие данные" еще со времен, когда такого термина не существовало, например поисковые системы или социальные сети, благодаря новым инструментам получают реальные возможности для увеличения прибыли. Однако самые впечатляющие результаты у тех компаний, которые выросли на "больших данных" с нуля. Не случайно стартапы из области Big Data на втором месте по популярности у венчурных фондов и бизнес-ангелов, инвестирующих в России. Это показал опрос в рамках исследования Venture Barometer Russia 2014, который в конце прошлого года провела компания Prostor Capital.
Создать продукт на основе обработки больших данных сегодня можно почти бесплатно — нужна только хорошая идея. К примеру, у HP есть Vertica Community Edition с полным набором необходимых функций. Кроме того, сотрудники HP могут проконсультировать по поводу реализации идеи: компания проводит воркшопы, тренинги и технические семинары. Предложение пользуется популярностью. "Каждый день я получаю десятки оповещений о том, что кто-то из России скачал наш продукт",— говорит Степанов. По его мнению, самые успешные проекты в этой области лежат на стыке индустрий. Корреляции могут быть самыми неожиданными. К примеру, анализ передвижения транспорта компании UPS показал, что, если ее грузовики при выборе маршрута чаще поворачивают направо, расходуется меньше топлива.
У Vertica Community Edition есть ограничения по масштабу и типу проектов, которые можно реализовать в системе. Компании, которые переросли эту версию, переходят на Enterprise Edition. При анализе разнородной неструктурированной информации можно использовать другой продукт — HP Autonomy. Это инструмент для анализа видеопотока, аудио, изображений, текстов из соцсети, новостных медиа и прочих источников.
Продукты Vertica и Autonomy могут поставляться на одной платформе HP Haven (она доступна и из облака), включающей соответствующее "железо". В одной из крупных международных компаний HP Autonomy применяют для поиска полезных сведений в потоке новостей из СМИ: платформа собирает информацию обо всех публикациях в прессе и анализирует их тон в автоматическом режиме. HP Autonomy оснащена множеством встроенных "коннекторов", которые могут быть подключены к источникам ТВ-потоков, новостных лент и т. д. Можно разобрать ТВ-картинку на составляющие в режиме реального времени, извлечь текст, проанализировать его, перевести на другой язык, сравнить лица, появляющиеся на экране, с теми, которые есть в базе данных.
По прогнозу IDC, на большие данные, в частности на медийную аналитику (анализ видео- и аудиоматериалов, изображений), в 2015 году в мире будет потрачено $125 млрд. Появится множество новых каналов, поставляющих открытые наборы данных для коммерческих компаний. Уже сегодня существуют дата-марты — онлайн-биржи, где продаются обезличенные данные из разных источников, в том числе информация о поведении потребителей, перемещении частного автотранспорта и т. д.
Новый способ поставки данных — Data-as-a-Service (DaaS; "большие данные как сервис") — набирает обороты. В этом случае коммерческое предприятие может периодически покупать нужные данные в "сыром" виде или уже после их обработки.
Дым отечества
В России большие данные часто используются только на уровне пилотных проектов. "Многие заказчики только начинают пробовать вкус больших данных,— говорит Владимир Баранов, генеральный директор EasyData.— Российский рынок больших данных только начал взрослеть, и до западного рынка, где подобных проектов тысячи, нам пока далеко. Но тенденция ясна: распространение инструментов класса Big Data в нашей стране неизбежно". По словам Баранова, до 2013 года в России был реализован только один проект на Vertica. С конца 2013 до конца 2014 года число заказчиков и проектов выросло в десять раз.
Баранов объясняет, что большинство российских компаний не готовы к обработке больших данных по причине непонимания пользы для бизнеса и отсутствия нужной инфраструктуры. Серьезный интерес к подобным проектам сейчас проявляют только крупные игроки, но, по словам Баранова, за последний год появились примеры, когда и относительно небольшие компании пытаются извлечь максимум из своих больших данных. По мнению Баранова, глобальная экономическая ситуация внесла коррективы, и быстрый рост популярности таких инструментов теперь передвинулся на более поздний срок, но он неизбежен.
Роман Баранов, руководитель направления Analytics & Big Data компании КРОК, напротив, считает, что кризис — время, когда нужно переходить от капитальных затрат к оптимизации, так что время для больших данных самое благоприятное. Он отмечает, что сегодня наблюдается повышенный интерес к аналитике в целом, инструментам прогнозирования, помогающим выявить пути оптимизации бизнес-процессов, затрат и т. п.
"Оптимизация методом проб и ошибок в кризисный период — это верный путь к гибели компании, так как ведет к лишней трате времени и денег. Поэтому без аналитики, в том числе больших данных, тут не обойтись,— объясняет Роман Баранов.— Например, ритейлерам крайне важно понимать, сколько товара будет продано в ближайший период, чтобы сформировать план собственного производства, закупок, перевозок, оптимизировать складские запасы и т. д. Телеком-операторов интересует вероятность притока-оттока абонентов, чтобы принять обоснованное решение о необходимости проведения той или иной маркетинговой акции, предложить новые услуги или изменить предложения по старым и пр. Крайне заинтересованы в лояльности клиентов и банки, особенно сейчас".
По подсчетам КРОК со ссылкой на аналитические данные, российский рынок Big Data последние года два растет примерно на 20-25% в год. Роман Баранов уверен, что рост продолжится. За 2014 год число проектов КРОК в этой области выросло вдвое.
Сергей Строганов, вице-президент по интеграционным решениям компании "Техносерв", считает, что сейчас рынок Big Data в России входит в фазу разочарований, неизбежную после эйфории от появления нового класса продуктов, и предшествует фазе зрелости и промышленного применения, которая наступит в ближайшие три-пять лет. "В отличие от Запада мы имеем запас времени, чтобы изучить опыт коллег и избежать рисков, связанных с отсутствием информации о реальных внедрениях. Это преимущество дает потенциал для снижения уровня возможных разочарований",— уверен он.
По словам Строганова, сегмент Big Data в России обречен на успех: "Это один из инструментов изменения качества жизни не только для организаций, но и для каждого из нас лично".