Машинное обучение пришло в астрофизику — используется при изучения широких атмосферных ливней элементарных частиц (ШАЛ) в Институте ядерных исследований. Точность восстановления частицы, вызвавшей ШАЛ, при использовании искусственного интеллекта оказалась выше, чем при нахождении ее другими способами. Работа выполнена при поддержке гранта президентской программы Российского научного фонда.
Фото: wikimedia.org
Земля постоянно бомбардируется космическими лучами. Космонавты на орбите испытывают их воздействие, получая очень высокую дозу радиации. Впоследствии это наряду с расслаблением мышц из-за отсутствия силы тяжести приводит к разнообразным заболеваниям. Но нас на Земле от воздействия космических частиц защищает атмосфера.
Когда космические лучи сверхвысоких энергий сталкиваются с атмосферой, влетевший в нее протон разбивает вдребезги частицы атмосферного азота, что запускает так называемый широкий атмосферный ливень элементарных частиц, и вся эта каша летит на Землю. Протон, теряя около 30% энергии, рождает пи-мезоны, другие заряженные и нейтральные частицы. Идет цикл столкновений и распадов. Количество частиц растет, а первоначальная энергия рассеивается. До Земли долетает около 10^10 частиц, а поперечный размер ливня достигает нескольких километров.
Как регистрируют ШАЛы
Впервые ШАЛы наблюдал Дмитрий Скобельцын в конце 1920-х годов. С тех пор их изучение существенно продвинулось. Для изучения космических лучей сейчас используется не только и не столько оборудование на орбите Земли, но и детекторы на Земле. По тому, в каком виде и откуда приходят на землю ШАЛы частиц, мы можем изучить, откуда к нам пришли космические лучи сверхвысоких энергий и что их породило. А приходят они, как правило, извне нашей галактики.
Для детектирования широких атмосферных ливней ученые-физики строят установки гигантских размеров на Земле. Так, в проекте Telescope Array в США в пустыне в штате Юта для детектирования используются больше 500 установок с сцинтилляторами (слои чувствительного вещества), автономно управляемых вычислительными блоками, работающими от энергии солнечных батарей, и снабженных GPS для точной фиксации времени события, по одной установке на каждый квадратный километр. Когда установка регистрирует событие (попадание ШАЛ на нее), компьютер автоматически записывает, что происходит дальше. Все данные автоматически отправляются на сервер и дальше по тому, какой детектор зарегистрировал частицы на момент раньше других, ученые определяют угол наклона ШАЛ, откуда к нам пришли частицы. С помощью трех мощных телескопов, расположенных в той же местности, ученые регистрируют свечение, которое оставляет ШАЛ. И сопоставляя данные с детекторов и телескопов, ученые делают выводы о том, откуда в атмосферу пришла изначальная высокоэнергетическая частица и какие у нее были заряд и свойства.
Второй метод детектирования ШАЛ — это наблюдение в телескоп свечения в ультрафиолетовом диапазоне. После прохождения ливня молекулы азота оставляют свечение. И в безлунную ночь можно наблюдать это свечение. В Юте установлены три таких телескопа. Они работают только в безлунные и безоблачные ночи, потому что должен быть очень низкий фон свечения. Телескопы покрывают довольно большой угол небосвода. Большие площади плоскогорья в Юте идеально подходят для эксперимента из-за низкого техногенного фона, сравнительно большого количества безоблачных дней и развитой инфраструктуры, поэтому Telescope Array установлен именно там. Наземные детекторы дают в десять раз больше статистики, чем телескопы. Поэтому ученые пока сфокусировались на наземных детекторах, а телескопы использовали для проверки своих предположений.
Предложенный метод
«Определение природы первичной частицы, родившей ШАЛ, направления, откуда она пришла, и ее энергии по наблюдаемым свойствам ливня — очень сложная задача. Решить ее более-менее надежно можно, только моделируя развитие ШАЛ в атмосфере и отклик детекторов на прохождение ливня через поверхность Земли. Развитие ШАЛ — результат многих миллиардов взаимодействий частиц, каждое из которых — вероятностный процесс. Для моделирования таких явлений используется так называемый метод Монте-Карло, суть которого в том, чтобы с помощью генератора случайных чисел и известных вероятностей взаимодействий в атмосфере смоделировать множество возможных реализаций ливня»,— говорит доктор физматнаук Олег Калашев, старший научный сотрудник Института ядерных исследований РАН.
Поскольку одна и та же исходная частица может привести к немного разным показаниям приборов на Земле, точно оценить свойства исходной частицы из измерений принципиально невозможно. Моделирование по методу Монте-Карло позволяет примерно определить отклик детекторов, если мы знаем свойства первичной частицы. Но в реальных экспериментах приходится решать противоположную задачу — определять свойства частиц по данным с детекторов. До сих пор это делалось с помощью довольно грубых методов, основанных на примерных оценках профиля плотности ШАЛ. В этой работе ученые предложили использовать для решения задачи аппарат машинного обучения с учителем, который дает универсальное решение, не используя никаких лишних упрощающих конструкций.
Среди алгоритмов машинного обучения были выбраны нейронные сети, поскольку известно, что они могут достаточно точно моделировать любые непрерывные функции. Точность основанного на нейронных сетях решения зависит от сложности модели, то есть числа свободных параметров. А сложность модели ограничивается числом примеров, с помощью которых обучается модель. Но каждый такой пример получается как результат ресурсоемкого Монте-Карло-моделирования, поэтому приходится балансировать между точностью модели и доступными вычислительными ресурсами. Искусство построения модели состоит в том, чтобы так подобрать архитектуру нейронной сети, чтобы при минимуме свободных параметров она хорошо описывала наблюдения. Для этого желательно учесть все известные симметрии задачи, связи между разными величинами и параметрами.
Для решения задачи авторы используют так называемые сверточные нейронные сети, широко применяемые для анализа изображений. Экспериментальные данные — показания прямоугольной сети детекторов, каждый из которых можно считать пикселем. В отличие от обычных цветных изображений число базовых цветов не три (красный, зеленый, синий), а два (зеленый и красный, то есть верхний и нижний слои детектора), но при этом необходимо анализировать не одно изображение, а видеоряд из 256 кадров. С помощью нового метода авторам удалось улучшить угловое разрешение эксперимента примерно на 30%. Этот показатель особенно важен для задачи поиска возможных источников космических лучей. Поскольку время, необходимое, чтобы «увидеть» точечный источник, пропорционально квадрату углового разрешения, можно сказать, что наша способность определить источник увеличилась почти в два раза.
Нейронные сети
Нейронные сети прямого распространения (в частности, многослойный персептрон) — это семейство алгоритмов машинного обучения, про которое известно, что они могут описать любую функцию с любой заданной точностью. Если нам надо увеличить точность, мы просто берем больше параметров. Но чтобы описать сложную функцию, нужно много параметров, а для этого нужно много примеров. Число свободных параметров алгоритма растет с числом входных данных. В данном случае наблюдались детекторы с двумя слоями чувствительного вещества (сцинтиллятора) и 256 измерений в каждом слое. К тому же на каждом событии срабатывает с десяток детекторов. Получается больше 5 тыс. входных параметров (чисел). И по этим числам нам нужно получить конечный ответ — угол наклона, откуда прилетел ливень (наше событие). Такие модели довольно сложно обучать. Казалось бы, можно было использовать самые простые нейронные сети, однослойные. У них мог бы быть миллион параметров. Но у нас ограниченное число событий, поэтому у нас слишком мало входных данных для таких сетей.
Поэтому авторы статьи выбрали класс нейронных сетей, придуманных для анализа изображений. Это так называемые сверточные сети. Допустим, у нас стоит задача распознавать рукописные цифры от 1 до 10. Неважно, написано число с краю или в центре, по бокам. Можно анализировать каждый пиксель, а можно — комбинацию пикселей. Эта нейросетевая модель учитывает симметрии задачи, формы. В них число свободных параметров значительно меньше, чем если анализировать каждый пиксель.
В карте попадания ливней на детекторы мы тоже используем изображения. Считайте, что каждый наш детектор — это такой пиксель изображения. Время прихода ливней на детекторы тоже дает информацию.
Все это дало неплохой результат. После проведения машинного обучения ученые сравнили данные, полученные аналитическими методами и с помощью методов машинного обучения, посмотрели величину стандартной ошибки модели (отклонение точек от нее в среднем). Погрешность метода таким образом можно измерить. Невозможно устранить ошибку совсем: мы имеем дело с явлением, где есть статистическая неопределенность. Поэтому всегда есть неустранимая ошибка реконструкции, так как это вероятностный процесс. Но в данном случае ошибка оказалась почти вдвое меньше, чем у стандартной реконструкции, сделанной не с помощью методов машинного обучения. Таким образом, сверточные нейронные сети показали свою эффективность при анализе воздействия космических лучей сверхвысоких энергий на атмосферу.
Использованы материалы статьи «Using Deep Learning to Enhance Event Geometry Reconstruction for the Telescope Array Surface Detector»; Dmitri Ivanov, Oleg Kalashev, Mikhail Kuznetsov, Grigory Rubtsov, Takashi Sako, Yoshiki Tsunesada, Yana Zhezher; журнал Machine Learning: Science and Technology, август 2020 г.