Несмотря на отчаянное сопротивление бизнеса, государство не оставляет попыток взять под контроль российский рынок big data, введя на нем жесткое регулирование (об очередных разногласиях “Ъ” рассказывал 21 февраля). При этом широкой аудитории в России, похоже, до сих пор неочевидно, за что развернулась буча.
Фото: Дмитрий Лебедев, Коммерсантъ
«Большие данные — что такое и зачем они нужны»,— дополняет «Яндекс» мой поисковый запрос, основываясь, разумеется, как раз на big data. Эти вопросы волнуют не только пользователей поисковика, но и всех причастных к обсуждению проекта поправок к закону «Об информации», где среди главных вопросов — само определение понятия «большие данные».
«Большие данные — это, по сути, довольно расплывчатое понятие»,— соглашается бывший специалист Google по большим данным Сет Стивенс-Давидович в книге «Все лгут». По его мнению, люди лгут «друзьям, любовникам и любовницам, врачам, опросам и самим себе», и единственное место, где можно узнать правду,— как раз массивы больших данных в поисковых системах: «Если вы считаете, что страдаете от депрессии, у вас нет мотива признать это во время опроса. Но он у вас есть, когда вы начинаете узнавать в Google о симптомах и возможных методах лечения». На основе поисковых запросов автору книги удалось, например, предсказать явку и результаты выборов 2016 года в США (люди обычно первым вводят в поиске имя более симпатичного им претендента).
Большие данные на основе информации из китайских онлайн-чатов позволили сотрудникам канадского стартапа BlueDot предсказать вспышку коронавируса на три недели раньше, чем о ней сообщило китайское правительство. Big data вовлечены и в борьбу с вирусом: например, 21 млн человек уже воспользовались приложением для путешественников, чтобы узнать, пользовались ли вашим маршрутом заболевшие. Команде ученых из Колумбийского университета и Microsoft в рамках исследования на основе поисковых запросов удалось выявить даже случаи рака поджелудочной железы, утверждает Сет Стивенс-Давидович, надеясь, что медицина станет одной из областей, «где большие данные на самом деле смогут помочь».
Если надежды на большие данные оправдаются, вопрос владения ими действительно будет волновать далеко не только рекламодателей, использующих big data, чтобы привлечь покупателей, как это уже происходит в том числе и в России. За рубежом к государственному надзору над смежной отраслью искусственного интеллекта уже не первый год призывает даже основатель Space X и Tesla Илон Маск, на прошлой неделе снова заявивший, что разработчики технологии должны находиться под внешним контролем. Похоже, пока сами пользователи созреют для решения, кому они больше готовы доверить свои данные — бизнесу или государству,— этот выбор сделают за них.