В 2013 году компания Microsoft запустила проект поддержки научных исследований в различных сферах — Microsoft Research. В прошлом году в рамках этого проекта открылась совместная лаборатория компании при МГУ. Успехи ее работы так впечатлили Microsoft, что та запустила специальную программу Russian Initiative для российских ученых — она дает им возможность пользоваться мощностями облака Azure бесплатно.
Russian Initiative — это локальное ответвление программы Azure for Research, конкурс для научных групп и проектов, победители которого получают доступ к ресурсам облака Microsoft Azure бесплатно в течение года. Это ценная возможность: практически любые исследования сегодня требуют сложных ресурсоемких вычислений, для которых необходимо либо закупать дорогое оборудование, либо арендовать инфраструктуру в том же облаке Azure, Amazon или любом другом. И довольно дорогое удовольствие, которое часто ученые не могут себе позволить, поэтому тестируют свои гипотезы на малых мощностях.
"Цель программы грантовой поддержки — дать ученым различных отраслей, использующим в работе анализ больших данных, возможность расширить зону работы и ускорить получение результата с использованием мощностей Azure,— пояснил Дмитрий Халин, директор департамента технологической политики Microsoft в России.— Таким образом Microsoft меняет способ взаимодействия человека с технологиями, предлагая смелые и оригинальные подходы к ИТ".
Программа Azure for Research действует во всем мире, но только в России ее решили расширить на локальном уровне. Этому способствовал успех другой программы поддержки ученых — Microsoft for Research. Это также глобальная инициатива компании, которая начала работать у нас с прошлого года. А в мире действует уже несколько лет. В рамках этого проекта Microsoft выдает гранты различным исследовательским группам. При Кембриджском университете функционирует лаборатория Microsoft Research, где трудятся известные ученые. Глава исследовательской группы по изучению климата и экологии в Кембридже Дрю Пювс занимается созданием компьютерной модели планетарной экосистемы. Ученый планирует включить в нее все данные о мировой биосфере и экологии. Это поможет лучше понимать происходящие на Земле процессы, в том числе изменение климата, и научиться влиять на них. Начал он с обработки географических и климатических данных с 1900 года до наших дней.
Дело на миллион
В прошлом году компания Microsoft вместе с МГУ открыла лабораторию в рамках программы Microsoft for Research. Компания предоставила финансирование — по некоторым оценкам, сумма достигла около $1 млн, эти средства будут потрачены в течение трех лет преимущественно на зарплаты ученых. Исследователи могут использовать и программные решения Microsoft. Одна из команд в этой лаборатории работала вместе с Дрю Пювсом над проектом FetchClimate.org. Это веб-приложение, работающее из облака Azure, предоставляет географическую информацию, включающую климатические данные, но далеко не только их. Пользоваться программой довольно просто: нужно выбрать место на карте, определить, что именно хочется знать (можно выбрать влажность воздуха или почвы, высоту над уровнем моря, температуру над поверхностью земли — всего около 20 параметров), установить отрезок времени и получить результаты, которые можно скачать с сайта в формате CSV, скопировать или отправить по электронной почте. Сервис агрегирует и обрабатывает информацию из различных источников: данные о сезонных колебаниях показателей, ежегодные, ежемесячные и ежедневные отчеты о разных местах земного шара. Дрю Пювс был вдохновлен уровнем подготовки наших соотечественников и значимостью их работы в мировом масштабе. Поэтому Microsoft и решила запустить локальную программу Russian Initiative специально для РФ. Конкурс Russian Initiative открылся в мае этого года. Участниками его могут стать ученые, которые работают над социально значимыми проектами в информатике, физике, химии, медицине, геологии, экологии, геномике и других фундаментальных дисциплинах. Если их заявка будет одобрена, проект получит возможность использовать Windows Azure в течение года. После этого, видимо, придется либо платить, либо закрывать лавочку.
Помимо FetchClimate группа из МГУ, которая впечатлила Дрю Пювса, использовала свои наработки для создания сервиса, визуализирующего историю Земли и человечества,— ChronoZoom. Свежая работа, о которой рассказали в мае этого года,— сервис для анализа и создания биологических моделей Bio Model Analyzer. Это прикладное ПО, работающее из облака, с привычным графическим интерфейсом, которое помогает молодым ученым на планшете, смартфоне или ПК конструировать биологические модели и проводить оценку некоторых их свойств. Это решение может применяться для академических исследований и прикладной науки, к примеру для разработки новых лекарств.
Другая команда, участвующая в Microsoft Research уже год,— группа лаборатории технологий программирования факультета вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова. Она специализируется на Data Mining — глубоком интеллектуальном анализе данных и машинном обучении, которые могут применяться для решения широкого круга задач. Например, для раннего обнаружения компьютерных вторжений в корпоративную сеть. Сергей Герасимов, сотрудник лаборатории технологий программирования МГУ, приводит и другой пример: речь идет о поведенческой мобильной аутентификации пользователя, которая предполагает анализ информации, поступающей с датчиков мобильных устройств (например, акселерометра, гироскопа). Ее можно применять вместо привычных, но не всегда надежных и безопасных паролей. Либо как дополнение к ним. "Преимущество платформы Microsoft Azure для наших исследований заключается в том, что она позволяет не только хранить большие объемы данных, но и параллельно исполнять сотни процедур обработки информации, что является критически важным для многих задач машинного обучения, например при оценке характеристик моделей или тонком тюнинге их параметров,— объясняет Сергей Герасимов.— Сейчас мы работаем над комплексом проектов в области больших данных и машинного обучения". По его словам, в облаке такие проекты вести гораздо проще.
Из сети — на митинг
Разработки лаборатории МГУ применяются также для текстовой аналитики (Text Mining). К примеру, один из проектов этой научной группы — программа, умеющая давать объективную оценку качества и профессионального уровня научных работ (статей, диссертаций и т. д.). Помимо проверки на плагиат система использует технологии семантического (смыслового) анализа текста, проводит библиографический анализ. Она способна также заменить эксперта, если интегрировать базу знаний и научить ее процессу принятия решений. "Сегодня значительная часть задач Data Mining сопряжена с анализом содержимого (документов, веб-сайтов) либо поведения пользователей и систем. Подобные задачи требуют надежной и производительной системы хранения и параллельной обработки данных",— объясняет Сергей Герасимов.
Еще одна научная группа, работающая в проекте Microsoft Research,— Центр изучения интернета и общества, который занимается анализом социальных сетей и поведения различных групп пользователей онлайн и офлайн. "Поскольку количество пользователей социальных сетей исчисляется миллионами, даже самый простой анализ структуры представляет собой нетривиальную вычислительную задачу, не говоря уже об анализе содержания сообщений,— рассказывает Иван Климов, руководитель центра.— Мы можем отслеживать распространение социальных сетей в различных городах России и изучать влияние их распространения на поведение людей в реальной жизни. Например, на их участие в различных сообществах, общественно важных действиях, протестных акциях. В перспективе данные позволят изучить, каким образом структура социальных сетей влияет на распространение информации и на то, как эта информация отражается на поведении людей офлайн".
Параллельно центр занимается исследованиями так называемой цифровой антропологии. Анализирует изображения в фотобанках, информацию об общественных выступлениях и митингах, лозунги. Тем самым он выявляет ключевые требования граждан-активистов, сравнивает их с теми сообщениями, которые звучат в онлайн-дискуссиях, фиксирует общественно значимые тенденции. Группа, кроме того, исследует филантропию и благотворительность, в частности феномен онлайн-благотворительности, когда люди делают взносы в интернете. "Некоторые наши исследования касаются и прикладных аспектов, таких как изучение роли мобильных гаджетов в повседневной жизни горожанина, формирование так называемого планшетного этикета, сетей неэкономического обмена и даже феномена лайка",— говорит Иван Климов.
По словам Сергея Березина, доцента МГУ, руководителя совместного исследовательского центра Microsoft Research в университете, контракт о сотрудничестве с Microsoft был подписан на три года, но затем может быть продлен. По его словам, все программные решения, которые рождаются в рамках этого партнерства, распространяются бесплатно и служат в основном научному мировому сообществу. О коммерциализации этих продуктов речь не идет — центр занимается только исследованиями. Впрочем, такие решения — хорошая иллюстрация возможностей Azure, что выгодно для Microsoft. Кроме того, если вдруг на базе научных групп возникнут стартапы, использующие результаты этих исследований для создания коммерческих приложений, они будут работать на платформе Microsoft. А это значит, что вендор будет получать лицензионные отчисления. Такие же цели преследует компания и в программе Azure for Research. По сути, это инвестиции в развитие экосистемы Microsoft. Причем связь с продуктами этого вендора создается на начальном уровне рождения инноваций и будущих прикладных решений — еще на этапе научных исследований. Самыми перспективными в компании считают технологии машинного зрения, а также методы анализа и визуализации больших данных.