Big data призывает революцию
Андрей Шварцкопф, генеральный директор хостинг-провайдера «Русоникс»
Когда-нибудь врачей заменят датчики на теле больного и мобильное приложение в его смартфоне. Человеку в предынфарктном состоянии подобное приложение напишет что-нибудь вроде «Срочно купи грушу и ешь ее, иначе через несколько минут у тебя будет инфаркт». Почему именно грушу и зачем ее есть именно сейчас? Этого не будет понимать ни приложение, ни человек, но совет будет полезным. Приложение сделает выводы на основе жизнедеятельности миллионов пациентов с такими же датчиками, установленными на их телах, и каждому из них оно даст рекомендации, которые будут работать.
Когда есть доступ к огромным массивам данных и возможность их обработать, то не нужны исследования — все сводится к банальной статистике. Если датчики вдруг обнаружат зависимость между поеданием груш и снижением риска инфаркта у миллионов людей, то приложение даст об этом знать, и причины такой взаимосвязи будут совершенно не важны.
Пример про пациента и грушу я выдумал, чтобы продемонстрировать, как работает big data, или «большие данные». Интернет-корпорации и сотовые операторы накопили большое количество данных о каждом из нас, а компьютеры способны с легкостью их обрабатывать и хранить. Поэтому совсем скоро подобные и при этом не вымышленные примеры будут реальностью.
Сейчас мы наблюдаем следующий виток развития интернет-технологий: появляются вещи, которые с помощью датчиков собирают информацию о нас и об окружающем нас мире. По прогнозу исследовательской компании Gartner, к 2020 году к интернету будет подключено 30 млрд устройств, большинство из которых не средства для коммуникации вроде смартфонов и компьютеров, а спортивные браслеты, холодильники с выходом в интернет и другие вещи. Они будут собирать данные и обмениваться ими для заботы о человеке. В ближайшие годы нас ожидают революции big data в медицине, криминалистике, устройстве городской инфраструктуры и других сферах.
Бизнес нашей компании — это продажа мощностей для хранения информации и вычислений, и я вижу, что такие мощности с каждым годом становятся все доступнее. Любой студент может позволить себе арендовать мощности на хостинге с производительностью, которую еще 10 лет назад могли позволить себе только научные центры. Программы для обработки «больших данных» тоже стали доступны каждому. Например, система Hadoop с открытым кодом и вовсе распространяется бесплатно.
Google давно считает big data своим конкурентным преимуществом. Корпорация может определить возникновение эпидемии гриппа в том или ином регионе планеты раньше врачей и сообщить об этом быстрее любых официальных источников: для этого Google достаточно наблюдать и анализировать рост поисковых запросов с названиями симптомов гриппа.
Уже начали появляться «пророческие» стартапы. Так, есть интернет-проекты, которые не просто находят самые дешевые авиабилеты, а предсказывают, в какой момент покупка билета обойдется дешевле всего. Программа анализирует большие объемы информации о ранее проданных авиабилетах и на основе статистики рекомендует пользователю, что лучше приобрести билет, например, за месяц, за неделю или за день до рейса.
О феномене big data пишут книги, а пытливые умы применяют принципы работы с «большими данными» даже в решении бытовых задач: видео, в котором девушка использует информацию, чтобы удачно выйти замуж, уже набрало более миллиона просмотров.
Самый актуальный пример для москвичей — использование данных сотовых операторов в градоустройстве. В 2014 году операторы начнут передавать информацию о перемещении абонентов в департамент информационных технологий правительства Москвы. Власти собираются использовать эти данные для создания полезных сервисов, например, для оповещения на станциях метрополитена о заторах на дорогах.
Москвичи вряд ли с радостью восприняли эту новость: к использованию личных данных по всему миру относятся противоречиво, особенно после разоблачений бывшего сотрудника ЦРУ Эдварда Сноудена. К примеру, в Германии, где я жил и работал около 20 лет, заявления Сноудена вызвали в деловой среде невероятный скандал. В том, что американские спецслужбы прослушивали переговоры с их участием, руководители немецких корпораций четко увидели не предотвращение террористических угроз, а банальный бизнес-шпионаж.
Пока я жил в Германии, я был убежденным противником обмена личной информацией. Я не пользовался социальными сетями, не вел блогов, не распространялся публично о том, что не связано напрямую с работой. Ведь эту информацию могут использовать против нас в личных, уголовных, политических, экономических целях. Сейчас я понимаю, что эти риски — только обратная сторона медали, на которой мы слишком зациклились. В противовес этим рискам мы приобретаем огромные возможности, которые заключены в массивах больших данных, и приближаем скачок в развитии человечества.