Пожарные отдыхают
Компьютерное моделирование позволит защитить лес от огня
Специалисты Исследовательского центра в сфере искусственного интеллекта на базе Сколтеха разрабатывают систему моделирования возникновения и развития лесных пожаров. Как это поможет МЧС и с какими трудностями столкнулись ученые?
Исследовательский центр в сфере искусственного интеллекта создан на базе Сколковского института науки и технологий при поддержке федерального гранта в конце 2021 года. Итоги отбора, в котором участвовали 36 организаций, были подведены на заседании рабочей группы, состоящей из 16 экспертов во главе с заместителем председателя правительства России Дмитрием Чернышенко. Сколтех вошел в число шести российских университетов и научных центров, которые стали опорными точками по развитию технологии искусственного интеллекта.
Рязань, Иркутск, Республика Саха (Якутия) — где только не полыхали пожары минувшим летом. Понятно, что моделирование их возникновения и развития — один из актуальнейших вопросов на экологической повестке дня. Почему эта задача до сих пор не была решена? «Тут много сложностей,— отвечает Дмитрий Шадрин, научный сотрудник исследовательского центра Сколтеха.— Во-первых, нужно понимать, какие данные, в частности про пожар, несут наиболее важную информацию, а какие менее важны, от каких можно отказаться, от каких — нет. Это большая исследовательская работа. Во-вторых, данные, необходимые для прогнозирования пожаров, очень разнородные даже по своему разрешению: некоторые можно получить с точностью до 1 км и выше, другие, например погодные, даже при разрешении 10 км могут быть недостаточно достоверными. Все их нужно "привести к общему знаменателю" — тоже задачка не из легких. К тому же нужно обучить искусственный интеллект».
«В качестве алгоритма мы использовали сверточные нейронные сети,— продолжает ученый.— Они позволяют работать с изображениями и выявлять определенные признаки и характеристики, а также прогнозировать динамику развития событий. Для прогноза пожаров они идеально подходят. На вход сверточной нейронной сети подаются изображения, представляющие определенные наборы пространственных характеристик. На входе необходимы два типа данных — статические признаки перед началом пожара и динамические во время развития пожара, которые ежедневно обновляются. Источники статических данных очень разнородные. Так, сведения о характеристиках растительного покрова, а именно индексе листовой поверхности, доле поглощенной ФА-радиации (фотосинтетически активная радиация — часть доходящей до биоценозов солнечной радиации, используемая растениями для фотосинтеза) и NDVI (normalized difference vegetation index, нормализованный вегетационный индекс) предоставляют спутники». «Высоту над уровнем моря мы получаем из цифровых карт рельефа,— рассказывает Дмитрий Шадрин.— Близость к дорогам и населенным пунктам — это данные ОSМ (OpenStreet Map — географическая карта мира, которую бесплатно создают пользователи интернета)».
Среди ключевых признаков, влияющих на распространение пожара,— тип растительности («Еловый лес горит лучше, чем смешанный»,— говорит Дмитрий Шадрин), плотность населения и плотность дорог. Для прогнозирования пожаров важны также динамические признаки — дневная и ночная температура, направление ветра, влажность, количество осадков — все эти погодные характеристики существенным образом влияют на распространение огня.
Для получения прогноза с использованием этих данных нужно обучить модель. Для этого необходимы сведения о пожарах, которые когда-то уже случились, причем сведения подробные, с информацией о том, как пожар развивался на определенной территории при известных погодных и других условиях, в том числе куда и как долго он продвигался, и все это с конкретными координатами. Данные должны быть верифицированы, то есть зафиксированы либо находившимися в этом районе людьми, либо изображениями со спутников. «Чем точнее описаны происшедшие пожары, тем лучше мы сможем обучить модель. Чем больше качественных данных, тем точнее будет прогноз»,— подчеркивает Дмитрий Шадрин.
Но вот проблема: не так-то легко получить необходимую информацию. Ограничено получение данных дистанционного зондирования Земли со спутников, а также оперативных данных МЧС. Так что свой первый пробный прогноз коллектив ученых составил для… Албании и Греции на один день — специалистам удалось собрать открытый датасет по этой территории, который содержит всю информацию, необходимую на входе предиктивной модели, а также эталонные маски, то есть, грубо говоря, контуры территории распространения пожара, на которых можно обучить нейросеть. «Наша модель спрогнозировала распространение по-настоящему случившегося пожара, границы которого были известны. Нам было интересно сравнить прогноз с реальной картой пожара. Маска, которую наша модель спрогнозировала, достаточно точно повторяет контуры этого реального пожара, и это на неполных данных»,— отмечает Светлана Илларионова, научный сотрудник исследовательского центра Сколтеха.
Сейчас специалисты центра ведут переговоры с МЧС о предоставлении полноценного набора данных для территории России, полученных из достоверных источников. «Мы находимся на стадии подписания соглашения с МЧС, в соответствии с которым для создания модели они будут предоставлять нам оперативные данные, и благодаря этому мы сможем уточнять нашу модель,— говорит замруководителя исследовательского центра Максим Мироненко.— То есть со стороны разработчиков и технологий нет никаких проблем, проблема только в реальных данных».
Информация нужна для разных зон России. «Нам важно, чтобы у нас были референсные данные как с юга России, так и, скажем, из Якутии, Иркутска, потому что в разных регионах разный растительный покров, разный климат,— отмечает Светлана Илларионова.— Модель, которая будет обучена на примере одной территории, может не сработать на другой, поэтому чем больше регионов России мы охватим, тем точнее будет прогноз, и ситуацию можно будет прогнозировать сразу на несколько дней вперед».
МЧС такой программный продукт нужен как воздух, ведь прогноз на основе ИИ позволяет приоритизировать пожары, то есть сортировать их в порядке важности. «Ресурсы пожарных ограничены, их нужно правильно распределить,— объясняет Дмитрий Шадрин.— Прогноз дает понимание, на какие пожары стоит обратить внимание в первую очередь, ведь где-то пожар идет на населенный пункт, а где-то просто лес выгорает». «МЧС рассчитывает индекс для приоритизации пожара. У них же не одна точка, и они должны понимать, какой тушить первым, куда силы и средства направлять,— поддерживает коллегу Максим Мироненко.— Какой-то пожар стоит немедленно погасить, пока он маленький, потому что через два дня он сильно разгорится или, что еще опаснее, двинется на населенный пункт — близость населенного пункта учитывается в первую очередь, а какой-то сам погаснет без участия людей. Наш прогноз позволит пожарным точнее рассчитать степень опасности и распределить ресурсы». Уже выбраны пилотные территории, где МЧС будет тестировать предложенную Сколтехом модель.
В планах ученых — научиться прогнозировать возникновение пожара. «Конечно, это не будет 0 или 1, — объясняет Дмитрий Шадрин.— Мы можем прогнозировать лишь некую вероятность: тут она больше, там — меньше. Такой прогноз можно построить по тем же признакам, что и распространение пожара. Учитывать нужно совокупность факторов: допустим, сухой лес, высокая дневная и ночная температура, близость дорог и населенных пунктов дают более высокую вероятность возникновения пожара, чем влажная погода и удаленность от городов». «Предиктивная модель будет снабжена своего рода объясняющим механизмом, который будет интерпретировать подсчитанные прогнозы и предоставлять пользователю пояснения, почему модель получила ту или иную оценку вероятности возникновения и развития лесных пожаров»,— добавляет руководитель исследовательского центра профессор Евгений Бурнаев.
На надежной платформе
И вот тут надо сказать, что прогнозирование пожаров — лишь малая часть той большой работы, которую ведет коллектив Исследовательского центра в сфере искусственного интеллекта. Задача центра — создать прикладное программное платформенное решение, связанное с устойчивым развитием территорий, чтобы внедрять его в индустрию.
Программный модуль, позволяющий моделировать возникновение и распространение лесных пожаров,— небольшой элемент единого платформенного решения. «В дальнейшем мы планируем работать над моделированием наводнений, засух, других стихийных бедствий и чрезвычайных ситуаций, чтобы минимизировать причиняемый ими экономический ущерб»,— подчеркивает Евгений Бурнаев.
«Помимо моделирования чрезвычайных ситуаций есть задачи, связанные с расчетом углеродного следа,— рассказывает Максим Мироненко.— Мы в сотрудничестве с Министерством науки и высшего образования, которое курирует все карбоновые полигоны Российской Федерации, строим модель углеродного баланса территорий, регионов и предприятий, чтобы снизить выбросы парниковых газов».
В рамках платформы создается решение, которое поможет регионам оценить, где лучше построить инфраструктуру с учетом таяния многолетней мерзлоты, где разместить мусороперерабатывающий завод с учетом розы ветров. «Буквально сегодня был пример: построенный в Ямало-Ненецком автономном округе садик через год "уплыл",— поясняет Максим Мироненко.— Его так ждали, столько денег в него вложили, а всего не рассчитали. Вот конкретная задача, где мы можем помочь. Мы скажем: вот здесь можно строить, риск таяния очень низкий, а здесь не стоит начинать строительство. Мы также создаем решение для расчета процессов переноса воздушных масс, что позволяет нам решать прямую и обратную задачи. Прямая задача — определить, как будет распространяться загрязнение от источника выброса, обратная — найти источник загрязнения и таким образом определить, кто "наследил"».
«Совместно с индустриальным партнером мы работаем над решениями для прогнозирования ледовой обстановки вокруг нефтяных платформ, чтобы танкеры могли безопасно к ним подходить. То же самое мы можем делать для Северного морского пути, чтобы облегчить навигацию»,— добавляет Евгений Бурнаев.
«Наше платформенное решение не просто моделирует различные ситуации, но и позволяет подсчитать прямой экономический ущерб, который может возникнуть при неблагоприятном развитии событий. Так, при помощи одного из модулей платформы можно будет оценить климатические риски, и такая работа уже ведется вместе с одним из крупных игроков в банковской сфере. Это поможет принимать информированные решения, например, при кредитовании строительства завода в Арктической зоне, что даст прямой экономический эффект».
«Уникальность центра в том, что мы делаем полный трек разработки программного обеспечения — от методологии и исследований до создания алгоритмов,— говорит в заключение Евгений Бурнаев.— У нас есть высококлассные ученые по обработке и анализу данных, которые понимают, как физические процессы переложить в математику, и есть разработчики, которые разрабатывают программный продукт. Помимо штатных сотрудников при разработке решений мы привлекаем специалистов в соответствующих прикладных областях. Например, если мы работаем в части нефтесервисных технологий, то приглашаем сейсмологов, геологов, которые хорошо в этом разбираются. Сейчас перед нами стоит задача к концу 2024 года объединить все разрозненные программные модули в единое платформенное решение для оценки различных рисков для задач устойчивого развития промышленности и экономики РФ. Мы уже сейчас начинаем работу по интеграции, но это уже следующий этап развития ПО».