ЦБ разработал метод анализа экономики по публикациям в интернете
Центробанк России разработал методику анализа экономической активности в стране, которая основывается на системах обработки больших массивов данных (big data). Об этом говорится в докладе департамента исследований и прогнозирования ЦБ «Оценка экономической активности на основе текстового анализа» (.pdf). В качестве исходных данных в предложенной модели используются новостные статьи из интернета. Их анализ производится методами текстового анализа и машинного обучения. «Приведенные расчеты показали, что использование такой неструктурированной информации, как новости, является не менее важной составляющей при прогнозировании экономической активности, чем использование обычных статистических показателей»,— говорится в докладе.
Полученные оценки качества модели показали, что разработанная методика успешно справилась с прогнозированием экономической динамики. «Это позволяет сделать вывод о том, что новостные данные обладают достаточно хорошей прогнозной силой. С помощью разработанного новостного индекса можно отслеживать динамику не только экономической активности на ежедневной основе, но также разрабатывать иные индикаторы, что позволит более оперативно реагировать на текущую экономическую ситуацию и принимать соответствующие решения»,— отмечается в докладе ЦБ.
Как используется big data и как в России защищают большие массивы данных, читайте в публикации «Ъ».