Алгоритм для природы

Как нейросети помогают планировать уборку берегов водоемов от отходов в труднодоступных регионах

Мир с каждым днем все чаще сталкивается с различными экологическими проблемами, во многом это связано со скоплением отходов в окружающей среде. Сильно загрязненной оказывается даже дикая природа, куда сложно добраться. Обычно за решение этой задачи берутся волонтеры, но их ресурсов часто не хватает. Поэтому им на помощь приходят технологии, в том числе ИИ. Одна из последних разработок — нейросеть, созданная студентами «Школы анализа данных» (ШАД) и экспертами «Яндекса». Она уже была протестирована на Дальнем Востоке. Нейросеть самостоятельно находит скопления мусора на карте и определяет его тип, давая волонтерам понять, сколько техники и людей понадобится для уборки участка. Что это за технология и как она помогает заповедникам на Камчатке, в Арктике и других регионах, рассказывают создатели проекта.

Фото: пресс-служба Южно-Камчатского федерального заказника

Фото: пресс-служба Южно-Камчатского федерального заказника

Для чего понадобилась нейросеть

Каждый год в мире производится около 400 млн тонн пластиковых отходов. Всего 10% из них перерабатывается. Все остальное оказывается на свалках и попадает в грунтовые воды и водоемы. Значительная часть пластика остается в океанах и частично выносится течениями на побережья.

Большую долю всех морских отходов составляет именно пластик, в основном это пищевая упаковка и рыболовные сети. Если не принять меры, к 2040 году количество таких отходов может увеличиться до 29 млн тонн.

«Арктике тоже достается. Ведь Мировой океан един. Состав отходов в разных локациях мира, конечно, разный. Нет сомнений, что необходимо убирать эти принесенные волнами отходы. В противном случае они попадут уже в экосистему суши или их смоет обратно в океан, где им не место»,— рассказала председатель правления ассоциации в сфере экологии и охраны окружающей среды «РазДельный сбор» Татьяна Нагорская.

Для решения этой проблемы создали нейросеть и выложили код в открытый доступ, чтобы его бесплатно использовали службы экологического контроля и волонтеры.

Что известно о новой нейросети

Студенты совместно с экспертами индустрии использовали искусственные данные, а также облачный сервис Yandex DataSphere с аэрофотоснимками, сделанными в Кроноцком заповеднике.

Нейросеть делит мусор на шесть основных типов: рыболовные сети, железо, резина, крупный пластик, бетон и древесина. Для мониторинга накопления и перемещения загрязнений используется сервис Yandex DataLens.

«Определение объектов на фотографии — достаточно типовая задача компьютерного зрения, однако для качественного решения необходимо наличие большого размеченного датасета, причем разметка весьма трудоемкая. В рамках проекта мы, с одной стороны, разработали инструмент для более быстрой разметки на основе фундаментальной модели Segment Anything, а с другой — экспериментировали с генерацией синтетических датасетов. В результате удалось обучить достаточно мощную модель SegFormer на основе трансформерной архитектуры»,— отметил технический директор лаборатории генеративного ИИ «Школы дизайна» НИУ ВШЭ, консультант по машинному обучению Yandex Cloud Дмитрий Сошников.

Как рассказал выпускник ШАД и один из разработчиков нейросети Артем Нургалиев, его основной задачей было улучшение качества сегментации мусора: в рамках этого он опробовал разные подходы по улучшению разметки в обучающей выборке и экспериментировал с архитектурой нейросети, осуществляющей сегментацию.

Как нейросеть применяют на практике

Решение успешно применили в экологической экспедиции в Южно-Камчатском федеральном заказнике на Дальнем Востоке. В прошлом году во время уборок использовали нейросеть, которая помогла установить основные источники загрязнения. Как оказалось, труднодоступные места побережий на 33–39% были замусорены пластиковой тарой и упаковкой и на 27–29% — отходами промышленного рыболовства. Эти данные позволили сотрудникам заповедника более эффективно организовать уборку: например, они заранее заказали специальную технику для сбора рыболовных сетей. Эксперты рассчитали, что для очистки берега потребуется группа из 20 волонтеров, два самосвала, два квадроцикла и фронтальный погрузчик. Благодаря использованию дронов и нейросети организовать уборку 5 тонн отходов удалось в четыре раза быстрее. Проект также тестируют в Арктике и других регионах.

Как отметил Дмитрий Сошников, модель уже используется другими командами. «Другие исследовательские группы в области экологии с помощью кода могут посмотреть, насколько такая модель применима в их условиях или же требуется дообучение модели на своих снимках. Мы надеемся, что сможем облегчить другим коллективам путь к автоматизации обнаружения и каталогизации мусора или как минимум заставить их задуматься о такой возможности»,— обратил внимание он.

В 2025 году технологию планируют использовать в других национальных парках и заповедниках Дальнего Востока и Арктики.

«Если модель окажется востребованной, на ее основе можно будет построить облачный сервис, которым смогут пользоваться различные заповедники и научные группы. Облако открывает путь к легкому масштабированию таких моделей, поскольку позволяет варьировать вычислительные ресурсы в зависимости от нагрузки»,— сказал Дмитрий Сошников.

Как готовят специалистов, создающих нейросети

Фото: Пресс-служба Яндекса

Фото: Пресс-служба Яндекса

Это не первый проект выпускников ШАД «Яндекса», связанный с окружающей средой и социально значимыми инициативами. Так, например, студенты ШАД совместно с экспертами Yandex Cloud разработали нейросеть в рамках проекта по мониторингу диких животных для национального парка «Сайлюгемский» в Республике Алтай. Алгоритм распознает десять разных видов животных на изображениях и видео, полученных с помощью фотоловушек на территории нацпарка.

Кроме того, при поддержке благотворительного фонда «Спина бифида» и НМИЦ имени Кулакова студенты создали ИИ-сервис для увеличения выявляемости заболевания Spina bifida на более ранних стадиях. Нейросеть анализирует изображения УЗИ беременных женщин и определяет вероятность наличия признаков патологии. Другим проектом стал сервис для прогнозирования распространения вулканического пепла. С его помощью спасательные, городские службы и ученые-геофизики могут быстрее оповещать международную авиацию, жителей и туристов о распространении пепла и эффективнее устранять последствия выбросов.

Все это стало возможным благодаря комьюнити студентов и преподавателей, которые работают в тесной связке друг с другом? и особому формату обучения. В нем помимо основной программы, разработанной ведущими исследователями и ML-специалистами, много практики. Обучение основано на реальных задачах бизнеса и науки, а преподают в том числе действующие сотрудники «Яндекса», которые сами создают технологии и продукты.

«У ребят в ШАД очень крутое комьюнити преподавателей и исследователей — это действующие представители индустрии и эксперты “Яндекса”, выпускники и студенты. Они обсуждают свои задачи, идеи, где-то даже “боли” и в чатах, и очно. Благодаря такому общению рождаются новые подходы к решению задач, стартапы, разные коллабы. Не менее важная вещь — содержание дисциплин, которые проходят студенты.

Обучение начинается с классических алгоритмов и подходов к ML-разработке, а продолжается современными подходами в проектировании и создании систем, в том числе использующих ИИ и конкретные технологии в обработке текстов, картинок и аудиоинформации. Всего в ШАД более 50 различных курсов — в течение семестра каждый студент должен успешно пройти как минимум три из них, что в будущем сделает его высококлассным и крайне востребованным специалистом»,— рассказала академический руководитель ML-направления ШАД Валентина Бронер.