Машины просто супер
Этим летом президент России Дмитрий Медведев провел совещание, на котором обсуждались проблемы суперкомпьютерной отрасли России. По итогам заседания было поручено разработать программу развития этой отрасли. Эксперты считают, что внимание государства к суперкомпьютерной отрасли уже само по себе является позитивным знаком, но для полноценного развития отрасли не хватает спроса со стороны бизнеса.
В конце июля президент России Дмитрий Медведев впервые определил приоритеты в суперкомпьютерной отрасли. На заседании Совета безопасности он заявил, что государство будет вкладывать в суперкомпьютеры, но остается открытым вопрос со спросом на такие вычислительные мощности. Президент отметил, что необходимо стимулировать спрос на этом рынке не потому, что это модно, а чтобы создавать конкурентоспособную продукцию. Дмитрий Медведев подчеркнул, что недостаточный спрос обусловлен тем, что с суперкомпьютерами и их возможностями не знакома огромная часть предпринимателей, не говоря уже о чиновниках. По словам президента, в стране лишь "считанные единицы моделей обсчитываются на суперкомпьютерах, а остальные делаются на ватмане с применением известных прежних подходов".
Министр связи и массовых коммуникаций России Игорь Щеголев согласился на Совете безопасности с тем, что о массовом внедрении суперкомпьютеров говорить пока рано. По словам министра, для этого предстоит еще создать центры управления, выделить деньги, стимулировать частно-государственное партнерство, а также выработать единые стандарты для обмена данными. Тем не менее уже сейчас Минкомсвязи готовит проекты создания новых суперкомпьютерных центров, увеличения мощностей существующих и объединения их в сеть. По словам министра, в России сейчас насчитывается 17 суперкомпьютеров, а осенью в Московском государственном университете пройдут пробные запуски систем мощностью 500 терафлоп.
По итогам заседания помощник президента Аркадий Дворкович сказал, что президенту подготовят предложения по созданию суперкомпьютеров и объединению их в грид-систему. Он уточнил, что государство рассмотрит возможность налогового стимулирования отрасли и что разработкой конкретных предложений будет заниматься специальная рабочая группа при президенте России.
Состояние индустрии
Суперкомпьютеры сегодня — это кластерные серверы с несколькими десятками, сотнями и даже тысячами процессоров, работа которых строится на одновременном выполнении задач, специально разделенных между собой в общей структуре исполнения программ, поскольку именно это необходимо для повышения быстродействия. Такой способ организации называется параллельными вычислениями. Эта отрасль программирования подразумевает разделение задач на множество потоков. Сегодня они актуальны для суперкомпьютеров из списка ТОР 500, но уже в недалеком будущем станут рядовым делом для пользователей настольных компьютеров.
По вычислительной мощи настольные ПК отстают от суперкомпьютеров примерно на 12 лет. Иными словами, по уровню производительности сегодняшние профессиональные ПК практически полностью соответствуют суперкомпьютерам 12-тилетней давности. Поэтому положение дел с высокопроизводительными вычислениями (High Performance Computing, HPC) определяет ситуацию на рынке персональных систем в следующем десятилетии. Современные суперкомпьютеры преодолели планку производительности в 1 петафлопс (квадриллион, или 1015 операций с плавающей запятой в секунду). Первая такая система (IBM Roadrunner) стоимостью $100 млн была представлена летом прошлого года. Профессор и писатель Стив Чен (США) попытался рассчитать, какая производительность необходима для решения различных задач будущего. По его мнению, аэродинамике хватит производительности в несколько петафлопс, молекулярной динамике — 20 петафлопс, а космологии — порядка 10 эксафлопс. Квантовая химия и молекулярное моделирование потребуют еще более мощных ресурсов.
Ведущие страны мира используют и совершенствуют возможности суперкомпьютеров для решения особо сложных задач науки, образования, экономики, для формирования долгосрочных прогнозов, в том числе в области метеорологии и экологии, с целью обеспечения национальной безопасности. В последнее десятилетие произошли заметные сдвиги в организации научного процесса: вследствие широкого внедрения вычислительной техники заметно усилилось направление компьютерного моделирования и численного эксперимента, что позволяет значительно повысить эффективность процессов научного и технологического поиска. Стало возможным моделировать сложные биологические структуры, имитировать взаимодействия систем, состоящих из колоссального количества микро-, нанообъектов, молекул и атомов, анализировать возможные способы их взаимодействия и результаты таковых, прогнозировать глобальные атмосферные явления и т. д.
Успехи России в суперкомпьютерной отрасли хотя и скромны для масштаба страны, но есть. В очередную редакцию списка 500 самых мощных суперкомпьютеров мира в июне 2008 года попали восемь российских суперкомпьютеров. В ноябре 2006 года в нем присутствовал лишь один, а в июне 2007 года — четыре. Этот список составляют и публикуют эксперты Джек Донгарра из Университета Теннеси, Эрих Штромайер и Хорст Саймон из Национального вычислительного центра энергетических исследований и Ханс Мойер из Мангеймского университета (Германия).
За комментариями по поводу положения дел с высокопроизводительными вычислениями в России мы обратились к Николаю Местеру, директору российского представительства Intel по корпоративным проектам. Николай Местер рассказал, что сейчас рынок суперкомпьютеров в России сегментирован по нескольким отраслям. "Первое направление — научно-технические вычисления, которые охватывают как фундаментальные науки, так и прикладные. Второе направление, близкое к первому, связано с образованием. Третье направление — промышленное. Здесь речь идет, к примеру, о таких вычислениях, как моделирование свойств веществ, поведения самолета в воздухе и проч. Есть даже пример из легкой промышленности, когда на суперкомпьютерах просчитывались свойства памперсов".
Николай Местер говорит, что суперкомпьютеры позволяют проводить более точные расчеты, что экономит не только время, но и деньги. "Раньше, когда расчеты проводились без суперкомпьютерных вычислений, многие вопросы решались с привлечением авторитета в данной области, который высказывал свое мнение. Такая ситуация была, к примеру, в авиастроении. Тогда проводились определенные расчеты, а дальше аппарат продували в аэродинамической трубе. Затем шло испытание самолета, цена образца которого превышает $1 млн. Суперкомпьютеры же позволяют предсказать, как будет вести себя самолет, и тем самым сэкономить $1 млн",— рассказал господин Местер. Он добавил, что инженеры в любом случае не могли просчитать все параметры, поэтому их число уменьшали. "Суперкомпьютеры к тому же позволяют просчитать ситуации "а что если", то есть, к примеру, поведение самолета при различных характеристиках. Без таких вычислений сделать это чрезвычайно сложно и дорого",— отметил господин Местер. Он добавил, что суперкомпьютерные вычисления уменьшили время, требуемое на разработку новой модели автомобиля, в три-пять раз. Самые мощные суперкомпьютеры используются в научных и образовательных учреждениях: "На производстве используются, как правило, системы раз в пять-десять менее производительные, нежели топовые модели в научных учреждениях. Стоимость хорошего вычислительного комплекса для промышленных целей может составлять $1,5-2 млн, а цена топовых моделей может доходить до $100-200 млн".
Николай Местер оценивает объем суперкомпьютерного рынка в России в сумму "от нескольких десятков до сотни миллионов долларов в год". "Разброс объясняется тем, что суперкомпьютеры строятся не каждый год. В каждой более или менее развитой стране в среднем два-четыре суперкомпьютерных центра, которые в среднем раз в два года делают апдейт",— объяснил господин Местер.
По словам Николая Местера, в Россию поставляют суперкомпьютеры в том числе и иностранные производители, например HP и IBM. Существует также российско-белорусская суперкомпьютерная программа, в рамках которой было создано несколько мощных систем.
Многоядерность
Два года назад мир перешел на многоядерные CPU, и это кардинальным образом изменило ситуацию с НРС: до этого рост производительности суперкомпьютеров происходил почти линейно, но с появлением четырехъядерных процессоров достижение производительности в 1 терафлоп существенно упростилось: сегодня это можно сделать с помощью одной "корзины" блейд-серверов, что доступно не только крупным, но и средним предприятиям. Однако экономика оказалась не готова к тому, чтобы эффективно использовать столь высокую вычислительную мощность. Возникли также проблемы с программным обеспечением, которое стало несостоятельным в решении задач распараллеливания вычислений на столь большое количество процессоров. Это одна из главных проблем, возникшая в связи с появлением суперкомпьютеров производительностью 0,5-1 петафлоп.
Упомянутая проблема касается ПО всех уровней. Операционные системы должны уметь работать с десятками тысяч ядер, поэтому встал вопрос об архитектуре суперкомпьютеров, поскольку программы просто не успевают адаптироваться к скачку производительности. Возникают сомнения: а следует ли продолжать "гонку за петафлопами" или лучше ограничиться системами среднего размера?
Важно отметить, что в России высокопроизводительные вычисления развиваются очень активно. Именно в этой отрасли наша страна может стать одним из мировых лидеров. Но для этого требуются серьезные усилия, финансовые вложения и прежде всего участие государства. Ни одна коммерческая структура не способна на координацию столь масштабных действий. Очевидно, активное участие в этом должно принимать научное сообщество, следует разработать программу коммерциализации результатов НРС.
Активно работавшая в 2007 году государственная программа "Образование" привела к появлению целого ряда установок, расположенных не только в Москве. В их числе: суперкомпьютеры в УГАТУ (Уфа), Новосибирске, Красноярске и Томске (первая реализация в рамках программы СКИФ).
Важнейшей практической задачей является внедрение суперкомпьютеров в индустрии. В августе 2008 года объявлено, что НПО "Сатурн" завершило проект создания суперкомпьютерного центра, где был запущен в эксплуатацию самый высокопроизводительный суперкомпьютер в промышленности России и СНГ — мощностью 14,3 терафлопс на базе 1344 четырехъядерных CPU Intel Xeon.
Широко применяются высокопроизводительные вычисления в нефтяной и газовой отрасли — правда, там для решения самых разных задач используются кластеры невысокой по нынешним меркам производительности — 2-4 терафлопс. К сожалению, в России неактивно ведется разведка новых месторождений, а значит, и нет острой потребности в более производительных компьютерах.
Еще одной перспективной для использования НРС областью является создание новых лекарственных препаратов. Высокопроизводительные вычисления позволяют заменить обычный скрининг (проверку очередного нового химического соединения на пригодность для лечения тех или иных заболеваний) целенаправленным моделированием нужных молекул веществ, которые в состоянии оказывать целенаправленное терапевтическое воздействие на болезнь и ее симптомы. И даже более того, HPC ускоряют и облегчают выявление причин человеческих недугов.
Руководитель программы СКИФ-ГРИД Сергей Абрамов рассказал, что, несмотря на отставание России в плане потребления суперкомпьютерных технологий, новые системы в стране появляются. "В суперкомпьютерной отрасли главное — это мотивация потребителей, то есть бизнеса и государства. И проблема здесь даже не в структуре экономики. Можно ведь оставаться добывающей страной, но при этом активно использовать суперкомпьютеры. Вопрос стремления к высшему качеству продукции. Суперкомпьютеры не будут востребованы, пока предприятия нашей страны не осознают необходимость конкурировать (в том числе и на международном рынке) путем повышения качества",— отметил господин Абрамов. По его словам, за рубежом суперкомпьютеры используются в любой отрасли, потому что все находятся в условиях жесткой конкуренции. "У нас же пока дела ведут "как вывезет". Ткнул в любой участок, где есть залежи нефти, и доволен, отвечать за невыбранные остатки не надо. Когда же ты понимаешь, что должен выжать все до капли, то начинаешь использовать суперкомпьютеры для расчета точки бурения",— отметил господин Абрамов.
Сергей Абрамов отмечает, что сегодня государство обращает все больше внимания на суперкомпьютерную отрасль. "Самое главное, что произошло,— сформулировали основы госполитики в этой отрасли. Это означает, что государству не все равно, что здесь происходит. Это важно, так как эта отрасль является инфраструктурой для экономики знаний. А инфраструктурные проекты делаются не компаниями, а государством. В самой капиталистической стране мира — в США — на эту отрасль тратятся из бюджета от $4 млрд до $6 млрд в год",— рассказывает господин Абрамов. По его словам, затем ресурсы суперкомпьютеров, созданных и содержащихся за госбюджет, бесплатно отдаются (по программе INCITE, например) и госучреждениям, и университетам, и вовсе не бедным компаниям, таким как IBM или General Electric.
По словам господина Абрамова, российский бюджет потратит в 2007-2010 годах, за четыре года программы СКИФ-ГРИД, около 450 млн рублей. А на две программы СКИФ и СКИФ-ГРИД с 2000 года по сегодня бюджет потратил — 470 млн рублей, в 2010 году предусмотрено еще 130 млн рублей. "Это все очень маленькие суммы, но и на эти деньги нам удалось создать 20 прикладных программных пакетов для вычислений в разных отраслях промышленности, а также 18 опытных образцов суперкомпьютеров. Пять супер-ЭВМ семейства СКИФ вошли в мировой TOP 500. Есть еще только одна российская машина, вошедшая в TOP 500 от России, она была создана ранее не нами — кооперацией во главе с НИИ "Квант"",— отметил господин Абрамов.
"Две из этих машин входили в первую сотню, в которой царят Япония, США и Китай, и только изредка туда попадают разработки других стран. К примеру, Германия как разработчик была в первой сотне только один раз",— рассказал Сергей Абрамов. Он отметил, что топовые модели суперкомпьютеров не продаются. "Они и технологии, опробованные в них, попадают на рынок только через три-пять лет, когда уже несколько морально устаревают. Машины из первой десятки TOP 500 не продаются, так как могут обеспечить превосходство страны в любой отрасли. На них можно рассчитать материал, изделие, технологию, которые будут вне конкуренции",— пояснил господин Абрамов. Он отметил важность поддержки государством конкурентных разработок супер-ЭВМ, что во времена СССР только в 80-х годах проводилось 15 конкурирующих между собой проектов по разработке суперкомпьютеров, 5 из них были доведены до реализации.
Сергей Абрамов рассказал, что сейчас по программе СКИФ-ГРИД созданы технологии, которые по 12 существенным показателям являются самыми передовыми в мире. "Мы создали работающие модули суперкомпьютера, которые в июне в работе демонстрировались на выставке в Гамбурге. Эту машину можно полностью произвести в России — все печатные платы, все конструктивы и модули, за исключением микросхем, которые приходится импортировать. Мы готовы сегодня создать систему мощностью 1 петафлоп, срок реализации не более года, стоимость — $100-120 млн, при разумных требованиях по энергетике и площадям",— заверил господин Абрамов.
Зачастую люди, не имеющие отношения к сфере развития современных технологий, задают вопрос: а зачем, собственно, нужны столь мощные суперкомпьютеры? Ответы на этот и другие подобные вопросы можно найти в недавно вышедшем IBM Journal of Research and Development (Volume 52, Number 1/2, 2008), который целиком посвящен различным аспектам использования массово параллельных высокопроизводительных вычислений. Прежде всего это области квантовой химии, квантовой молекулярной динамики и все, что с ними связано, от разработки новых лекарственных препаратов до моделирования ферментов и клеточных структур. Сейчас с помощью HPC изучаются механизмы устойчивости вирусов к воздействию на них лекарственных препаратов, выявляются причины возникновения аллергических реакций и аутоиммунных заболеваний.
До последнего времени поиск подходящего лекарственного препарата выглядел как экспериментальный отбор (методом проб и ошибок) пригодных соединений из огромного количества синтезированных молекул, которые, как предполагали исследователи, должны обладать терапевтическим эффектом. Однако если сократить количество производимых в пробирке веществ хотя бы в несколько раз, можно сэкономить огромные средства. Именно это и позволяют делать суперкомпьютеры. Моделирование дает возможность отбраковать структуры, заведомо не подходящие для обеспечения нужных химических превращений, еще до начала испытаний.
Безусловно, больших вычислительных ресурсов потребует активно развивающаяся генетика. В частности, успешно разрабатываемые методы исчерпывающего анализа ДНК человека при их широком внедрении могут еще при рождении выявить предрасположенность к возникновению и развитию ряда заболеваний. Однако получение, обработка и хранение столь обширной информации потребует существенного увеличения вычислительных ресурсов.
Огромную роль играют НРС при разработке и создании современных электронных микросхем. Здесь можно выделить несколько уровней моделирования. Первый — расчет характеристик транзистора еще до его создания. В самом транзисторе, создаваемом по современным технологическим нормам, вместе с контактами содержится около миллиарда атомов, однако размеры структур столь малы, что для полного описания его характеристик необходимо использовать сложные квантово-механические расчеты. Полное описание поведения системы, состоящей из миллиарда атомов,— очень важная задача, которая до сих пор не решена в полном объеме.
После того как станут ясны электрофизические характеристики самого транзистора, возникает следующая задача — моделирование поведения самого процессора. Напомним, что сегодня он состоит из миллиардов логических элементов, причем каждый полевой транзистор моделируется эквивалентной схемой (около 20 элементов). Таким образом, для описания электрических процессов, протекающих при работе чипа, нам придется учитывать работу 20 млрд таких элементов, а это невозможно сделать без использования мощных параллельных вычислительных систем.
Промышленность все активнее пользуется НРС. Практически все авиастроительные компании проводят комплексное моделирование аэродинамических характеристик планеров, сокращая время и ресурсы, которые требуются для натурных испытаний в аэродинамических трубах. Точно так же поступают и все автогиганты при анализе аэродинамических характеристик новых моделей. Многие автомобильные компании сегодня делают существенно меньше натурных краш-тестов (связанных с разрушением автомобилей при их столкновении с препятствиями), поскольку эти ситуации моделируются на компьютерах.
В НПО "Сатурн" моделируется процесс работы турбины современного реактивного самолета, например, для расчета последствий попадания в нее птицы. Ведь минимизировать негативные последствия такой ситуации — значит спасти жизнь членов экипажа, пассажиров и само воздушное судно.
Одна из серьезных проблем, о которой уже упоминалось,— неготовность современного ПО использовать нарастающие возможности НРС. Но проблема еще шире: не только программисты, но и многие ученые и разработчики в промышленности просто не знают, какие возможности предоставляют им современные вычислительные системы, насколько они сейчас доступны, как можно использовать их возможности в конкретных делах.