"Мы получили результаты, которые многим показались парадоксальными"
В рамках Петербургского экономического форума состоялась дискуссия об использовании "больших данных", в частности геопространственной аналитики, для решения коммерческих и социальных задач. Мы беседуем на эту тему с РОМАНОМ ПОСТНИКОВЫМ, директором по сегментному маркетингу и клиентской аналитике ОАО "МегаФон".
— Давайте сначала о технологии. Расскажите, какого рода данные вы получаете и каким образом?
— В основе сервиса геопространственной аналитики лежат принципы работы сотовой сети, которые в целом неизменны с 80-х годов 20-го столетия. Для того чтобы вы получали звонок или SMS, коммутационное оборудование любого сотового оператора должно знать, к какой базовой станции вы подключены в каждый момент. Это нужно для правильной маршрутизации вызова. Дополнительно к этому, например в случае, если вы перемещаетесь в процессе разговора, коммутатор должен вас переключить с одной базовой станции на другую максимально быстро и без задержек. Таким образом, коммутатор видит статистику: сколько абонентов переключилось с одной станции на другую 24 часа в сутки. Именно эти данные по статистике переключений между базовыми станциями сотового оператора и являются первичной информацией. Абонентов десятки миллионов, базовых станций тысячи, и вы легко можете представить, насколько это большой объем информации.
Сервис геопространственной аналитики изучает динамику объемов переключений между базовыми станциями и может интерпретировать такие данные в зависимости от конкретной задачи. Сегодня мы видим, что результаты можно использовать не только для решения чисто операторских вопросов (например, для планирования салонов или строительства сети), но и для эффективного планирования городской среды и управления городской инфраструктурой, а также для решения бизнес-задач коммерческими организациями. На прошедшем Урбанистическом форуме в Москве (ноябрь 2013 года) мы показали некоторые результаты, которые многим показались парадоксальными. Выяснилось, например, что только 40% жителей московских окраин ежедневно совершают поездки из дома на работу через центр. Это говорит о том, что, скорее всего, потенциал роста московских пробок еще не исчерпан. Или, например, для нас не составило труда выяснить, что в первые две недели после открытия станции метро "Жулебино" порядка 18% пассажиров метро составили бывшие автомобилисты.
— То есть вы отслеживаете, что такой-то абонент вчера находился в зоне действия наземных станций на Волгоградском проспекте, а сегодня его засекли станции метрополитена?
— Конечно же, нет. Геопространственная аналитика, как уже говорилось, основана на полностью анонимной статистике о количестве переключений между базовыми станциями в течение суток, если говорить грубо, то это просто число абонентов, которые перешли с базовой станции A на базовую станцию B в течение короткого интервала времени. Объединив статистику по количествам переключений между станциями за более длительный интервал времени, мы получаем возможность рассчитать, какое количество абонентов использовало вчера базовые станции на Волгоградском проспекте, а сегодня — в метро.
Принципиальным для нас с точки зрения сохранности информации было в том числе решение развивать подобные сервисы и обрабатывать первичные данные только "своими руками", без привлечения субподрядчиков. Это редкость на российском рынке, где операторы, как правило, отдают подобные задачи партнерам.
В других странах операторы, например Telefonica в Великобритании, уже предлагают рынку аналогичные продукты, и с точки зрения подхода к сохранению неприкосновенности частной жизни абонента мы полностью повторяем накопленный опыт.
— А теперь давайте поговорим о практическом применении полученных с помощью геопространственной аналитики данных.
— Геопространственный анализ изначально начинался с решения ряда задач внутри оператора. Например, где расположить розничные точки, так чтобы это было удобно максимальному числу наших абонентов с учетом ежедневных маршрутов перемещения. Где нужно увеличить емкость сети передачи данных, так чтобы ускорить мобильный интернет у максимально большего числа наших клиентов.
— А каким образом полученные вами данные могут послужить для решения городских задач?
— Внедрение технологий геопространственной аналитики способно улучшить жизнь мегаполиса, обеспечить его процветание благодаря повышению качества жизни каждого его жителя. В процессе управления городом все взаимосвязано: транспортная доступность влияет не только на мобильность населения, но и на экологию и безопасность городской среды. Последние, в свою очередь, влияют на здоровье, продолжительность и качество жизни граждан.
Множество крупнейших городов по всему миру уже успешно реализуют концепцию "умного" города. Примерами могут служить Вена, Нью-Йорк, Гонконг, Лондон, Париж, Берлин, Барселона, Сидней и другие. Россия пока только начинает двигаться в направлении комплексной концепции "умного" города, применяя технологии геопространственной аналитики для интеллектуализации городской среды.
В России наблюдается стремительный рост проникновения мобильного интернета (на данный момент составляет около 50%), что говорит о перспективности использования мобильных услуг и приложений для реализации городских нужд.
— Но ведь существует статистика, переписи населения. Зачем еще и геопространственная аналитика?
— Переписи населения, к сожалению, не дают точной информации по количеству жителей. Во-первых, они проводятся раз в пять-десять лет и это крайне затратное мероприятие. Во-вторых, многие территории являются частной собственностью и переписчики просто туда не попадают. Сегодня, после присоединения к Москве новых территорий, неизбежно возникает вопрос их эффективного развития. Для решения подобных задач в рамках сервиса мы реализовали алгоритмы, которые дают очень точную картину по количеству жителей практически в реальном времени. От точности этого расчета напрямую зависят качество и цена решений по развитию городской инфраструктуры — зон отдыха, пешеходных зон, больниц, детских садов, школ.
Подобные сервисы дают толчок к построению точных макроэкономических моделей развития городских территорий в целом, цена ошибки в которых с учетом масштаба инвестиций, как правило, крайне велика.
Кроме того, несмотря на то, что клиентская база "МегаФона" — это не все население России, а только его треть, за счет того что в ней представлены абсолютно все слои и социальные группы населения, можно сделать достоверные и релевантные выводы о ситуации в целом. Достаточно вспомнить, например, что для точного определения позиций кандидатов на выборах используются экзит-полы, когда опрашивается несколько тысяч человек по всей стране. И это дает результат с минимальной погрешностью.
— Предполагаю, что геопространственная аналитика — дело довольно затратное. Кстати, насколько затратное? Какая доля расходов компании на нее приходится? И возможна ли монетизация этой статистики?
— Мы предлагаем наши сервисы коммерческим организациям и государственным структурам. У нас уже есть три крупных заказчика и еще с несколькими переговоры находятся в финальной стадии. Цена такого сервиса индивидуальна и зависит от объема конкретных задач. Но на наш взгляд, возможность на самом раннем этапе точно предсказать, как будет развиваться город в перспективе и, соответственно, как подстроиться под эти изменения, крайне ценна, ведь крупные инфраструктурные проекты работают не одно десятилетие. И затраты на качественный предпроектный анализ в масштабах всего проекта фактически несущественен. Причем это верно как для коммерческих, так и для государственных проектов.
Что касается инвестиций в развитие сервисов анализа больших данных в целом и геопространственной аналитики в частности, то, как ни странно, для сотового оператора инвестиции незначительны в общем объеме. Основные вложения делаются в развитие ключевых активов, в частности сети. В конечном итоге для клиента всегда будут важнее качество связи и скорость мобильного интернета.
— Само понятие "геопространственная аналитика" появилось считаные годы назад, а технологии развиваются очень быстро. Каковы, на ваш взгляд, перспективы этого направления в ближайшие несколько лет?
— Направление развития этого класса сервисов уже, по сути, определено на старте — это обеспечение качества и безопасности жизни в больших городских агломерациях. Плотность населения, сложность "дорожной карты" будут только расти, и здесь помимо задач, связанных с планированием, на первое место будут выходить удобные услуги для населения на основе геоанализа.