"Накапливать данные ИТ-общество уже научилось"
АНДРЕЙ НУГМАНОВ, партнер компании AT Consulting, директор блока BI, рассказывает, почему в большие данные в России инвестируют, несмотря на кризис.
— Системы для работы с большими данными — это дорогостоящие технологии, покупают ли их сегодня во время кризиса?
— Наша компания работает в сегментах, где ИТ-технологии — неотъемлемая часть бизнеса клиентов. Принимаемые сейчас решения будут основой для дальнейшего развития. Шаг за шагом мы погружаемся в цифровой мир, основу которого уже сегодня составляет глубокая аналитика, требующая обработки максимально доступного объема информации.
Де-факто компоненты Big Data становятся стандартным элементом архитектуры любых аналитических решений, которые сейчас проектируются и внедряются. Этим и объясняется рост спроса на подобные системы. Мы постоянно расширяем горизонты во взглядах и подходах к хранению и обработке данных, яркие примеры этому — технология Apache Hadoop и парадигма MapReduce. Стек технологий Hadoop в первую очередь, как система дешевого хранения данных, стал неотъемлемым компонентом для обработки больших данных, и сейчас является частью Big Data-инфраструктуры многих компаний в различных сферах. К тому же с финансовой точки зрения Hadoop значительно выгоднее традиционных реляционных систем благодаря бесплатному лицензированию и дешевому "железу".
С нашей помощью заказчики реализуют все больше задач, связанных с детальным анализом предпочтений клиентов, например с использованием геолокации. В сегменте В2С востребован контекстуальный маркетинг, в В2В — скоринг потенциальных клиентов и мобильная реклама, в В2G — программы, связанные с "умным" городом: системы анализа транспортной ситуации и развития городской инфраструктуры, решения по общественной безопасности и т. д.
— Есть мнение, что Big Data как маркетинговая история мертва. Об этом много сейчас говорят на иностранных конференциях. Согласны ли вы с таким утверждением?
— Происходит естественный процесс трансформации маркетинговой активности. То, что из тренда ушел термин "Big Data", но появился "Machine Learning", говорит о том, что накапливать данные ИТ-общество уже научилось и сейчас сосредоточилось на обработке и извлечении из них выгоды. Именно поэтому в текущем цикле зрелости методологий Gartner мы можем наблюдать смещение фокуса с Big Data на Machine Learning как следствие эволюции технологии, начала ее практического использования. Ее больше не боятся. Даже появилась новая профессия — Data Scientist. Эти специалисты занимаются поиском монетизации информации, созданием новых ценностей для клиентов. Это долгий и итерационный путь, требующий уникальных знаний. С одной стороны, важно глубокое понимание аналитических алгоритмов обработки данных, а с другой — бизнес-процессов, за счет которых происходит обслуживание клиентов, и используемых ИТ-технологий.
— Какие перспективы у больших данных в России? Кто основные потребители? Как будет развиваться ситуация?
— Рынок больших данных в России динамично развивается. Сейчас эта технология применяется не только в телекоме и банковском секторе, но и активно внедряется в страховании и ритейле. В области банковских и телеком-решений российский и западный рынки развиты примерно одинаково. В сфере решений для страхования и ритейла отечественный рынок отстает от западного на два-три года. К примеру, рекомендательные системы в западных интернет-магазинах — стандарт де-факто, а для большинства российских это все еще технологическая новинка, нередко дорогостоящая.
Также большими данными в тестовых целях стали интересоваться многие компании малого и среднего бизнеса. На небольших проектах бизнес пробует, зачастую успешно, найти недорогое решение своих задач.
Но это только первые шаги. Сейчас компании, использующие глубокую аналитику на основе Big Data, в основном не стремятся делиться этой информацией с рынком. Основной прорыв произойдет после изменения подхода к данному вопросу и после того, как рынок будет открыт для информационного обмена между участниками. Придет время единой цифровой среды, в которой будут создаваться конвергентные сервисы для конечных клиентов.
— За последнее время какого рода проекты в этой области можно назвать трендовыми, заметными?
— В первую очередь это важные шаги российских компаний в направлении обмена информацией, поиска путей создания новых сервисов, в частности между банками и телекомом.
Популярным становится взаимодействие, направленное на снижение рисков по реализации банковских продуктов. Например, при совместном участии банка и телеком-оператора была разработана распределенная система подсчета скорингового балла для сервиса принятия решений по выдаче кредита. Банк начал использовать ранее недоступную информацию для оценки кредитоспособности потенциального заемщика на основе данных, которые имеются у оператора. Таким образом, банки расширяют собственные знания о заемщиках и могут делать более точные прогнозы по возврату кредитов. В текущей непростой экономической ситуации это позволяет повысить качество кредитного портфеля, снизить вероятность возникновения расходов, связанных с обслуживанием кредитов, избежать ошибок, имеющих конкретные финансовые последствия.
— Какие у вас ожидания по выручке с этого направления в компании по итогам текущего года?
— Проекты в области больших данных, как я уже сказал, переходят в практическую плоскость и становятся значимым сегментом в объемах наших работ — как по спектру решаемых задач, так и в денежном выражении. Мы активно развиваем это направление и в 2015 году ожидаем двукратный рост выручки от проектов Big Data. По нашим оценкам, темпы будут только нарастать.