Машинное обучение меняет химию и физику
Новые материалы создаются при деятельном участии искусственного интеллекта
Люди всегда искали новые материалы. Сегодня им в этом помогает искусственный интеллект. Никита Казеев, выпускник Школы анализа данных «Яндекса» и сотрудник лаборатории нобелевского лауреата Константина Новоселова, рассказывает «Ъ-Науке», как машинное обучение открывает катализаторы и повышает эффективность солнечных панелей.
— Я занимаюсь применением машинного обучения для поиска новых материалов в группе нобелевского лауреата Константина Новоселова. Поиск материалов — давнее увлечение человечества. В доисторические времена освоение нового материала было настолько революционным, что в его честь называли целые периоды: каменный век, бронзовый, железный. Новые материалы радикально меняли жизнь людей, позволяя производить более эффективные орудия, быстрее строить дома, проще добывать пищу и т. д.
Какими будут материалы
Следующая революция произойдет, когда появится высокотемпературный сверхпроводник — он нужен для передачи энергии на огромные расстояния без потерь, повышения эффективности поездов на магнитной подушке, очистки воды и других задач. В идеале сверхпроводники должны работать при комнатных условиях, но пока этого не удалось достичь.
Раньше материалы создавали методом проб и ошибок. Кто-то что-то смешивал, экспериментировал, что-то получалось, а что-то — нет. Постепенно появились теории, обобщающие этот опыт. Специалисты измеряли, сколько нужно добавлять углерода к железу, чтобы получалась сталь определенной хрупкости, и выводили уравнения таких зависимостей. Пытались предсказать существование материала теоретически, а затем находили его экспериментально.
Компьютерные симуляции позволили отказаться от дорогостоящих поисковых экспериментов. Можно взять и считать, какой сплав получится, если смешать железо и никель в определенной пропорции, хватит ли ему прочности или нет. Такое моделирование заменило этап проб и ошибок на вычислительный, когда компьютер перебирает возможные варианты материалов. Но симуляция требует компьютерных ресурсов. Например, в нашем проекте расчет статических свойств небольших структур из 192 атомов занимает сутки и требует 24 ядер процессора. В сложных проектах с миллионом атомов нужна уже неделя расчетов на специализированном суперкомпьютере с тысячами ядер.
В целом задачу создания новых материалов можно свести к перебору множества структур. У нас есть вся таблица Менделеева, из которой можно собирать варианты. Важен не только состав, но и пространственная конфигурация, которая зависит от процесса производства: тот же углерод может стать графитом, алмазом или графеном, не говоря даже про органические молекулы. Перебор — долгий процесс даже при использовании компьютерного моделирования.
Как машинное обучение открывает новые материалы
Следующий этап эволюции — призвать на помощь искусственный интеллект. Сделав несколько тысяч расчетов и изучив алгоритм машинного обучения, мы получим возможность в сотни и тысячи раз быстрее моделировать другие похожие системы и динамические процессы. Более новое и «творческое» применение искусственного интеллекта — предлагать варианты материала для рассмотрения, а не просто быстро валидировать варианты, перебираемые человеком.
Большинство традиционных материалов имеют фиксированные свойства: например, они только гибкие или жесткие. Цель нашей лаборатории — создавать «умные» адаптивные материалы, свойства которых могут динамически меняться. Это важно для разработки искусственных органов, «умных» фильтров для воды, нового поколения аккумуляторов и других прикладных задач.
Компьютерное моделирование вещества требует перехода между масштабами — от отдельных атомов и пикосекунд к макроскопическим системам и временам. Это особенно актуально для «умных» материалов: чтобы появились динамические свойства, необходимы нетривиальные структуры, и им нужно время, чтобы сработать. Машинное обучение позволяет обучиться на точных квантовых расчетах различных вариантов атомных конфигураций и перейти к более масштабному моделированию. Или вообще построить эмпирическую модель по экспериментальным данным.
К примеру, ученые из MIT недавно внедрили машинное обучение для создания материалов для 3D-печати с нужными характеристиками вроде жесткости и упругости. Их алгоритм подсказывает полезные химические соединения, которые люди могли пропустить. С его помощью исследователи смогли создать чернила для 3D-печати, которые затвердевают под воздействием ультрафиолетового света. Это сложная задача: материал должен быть достаточно вязким, жестким и прочным. При ручном подходе химики тестировали бы каждое соединение по очереди, пытаясь максимизировать одну характеристику за раз. Результатом стали бы множество экспериментов и куча отходов. Машинное обучение определило 12 лучших материалов с оптимальным сочетанием всех трех свойств после проверки всего лишь 120 образцов.
По сути, машинное обучение становится обычным инструментом современной науки. Меня ему научили в Школе анализа данных «Яндекса». ШАД вообще полезна для начинающих ученых: в науке много рутины, но подлинные прорывы требуют рождения новых решений и принципов. Нужно сидеть и думать, как решить ту или иную задачку. Обучение в ШАД во многом состоит из работы именно в таком режиме.
Как новые материалы приближают будущее
Без новых материалов в будущее попасть не удастся: они должны совершить следующую технологическую революцию. Чтобы создать космический лифт, нам потребуется материал, который выдержит нагрузку. Для развития зеленой энергетики нужны эффективные солнечные батареи — и здесь не обойтись без более эффективных материалов.
К примеру, перовскиты — это семейство материалов, которые позволяют делать более тонкие и легкие солнечные панели, чем используются сейчас. Проблема в том, что они очень сложны в производстве. Исследователи из MIT и Стэнфорда использовали машинное обучение для обобщения экспериментальных данных. Результатом стало производство перовскитных элементов с эффективностью преобразования энергии 18,5%. Это высокий уровень для современного рынка.
Другой потенциальный способ получения чистой энергии — добавление в воду катализатора, который под действием солнечного света будет производить водород и кислород. Получается самое экологически чистое топливо с минимумом затрат. Проблема — в создании катализатора, который должен не только работать, но и быть простым и дешевым в производстве. В 2021 году прошел Open Catalyst Challenge, чтобы популяризовать применение машинного обучения в поиске недорогих катализаторов, способных запускать реакции для преобразования возобновляемой энергии в удобную для хранения форму. Участники соревнования должны были разработать ML-алгоритмы для имитации более 660 тыс. расчетов свойств катализатора. Победивший алгоритм Graformer предсказывает конфигурацию с минимальной энергией с точностью 89% — это позволит сократить не менее половины расходов при расчетах. Кстати, наши соавторы из Иннополиса заняли второе место.
В будущем нас ждет еще больше вычислительных мощностей — и больше данных. Обученные на «всем интернете» модели для работы с текстами и изображениями качественно превосходят все, что было раньше. Например, я переводил часть своей диссертации на русский язык с помощью машинного перевода: получилось всего по одной ошибке на несколько предложений, и это для сложного научного текста. Рано или поздно мы придем к подобному уровню и для материалов. Проанализировав миллиарды рассчитанных структур, алгоритм ответит, из чего сделать космический лифт и шнурки, которые не будут развязываться.