Слышали ли вы, что НАСА (Национальное управление по аэронавтике и исследованию космического пространства) недавно обнаружило 301 новую неизвестную экзопланету с помощью глубокой нейронной сети под названием ExoMiner? Вероятно, нет. Некоторые люди даже не знают о терминах Exoplanet и ExoMiner. Что ж, не нужно беспокоиться, потому что эта статья развеет все ваши сомнения по поводу Exoplanets и ExoMiner? Итак, приступим к делу.

В космосе подсчитано, что в среднем на каждую звезду в галактике приходится как минимум одна планета. Согласно Науке НАСА, Галактика — это не что иное, как совокупность газа, пыли, звезд и их солнечных систем, включая планеты, удерживаемые вместе гравитационной силой. Это означает, что только в нашей галактике (Млечный Путь) за пределами Солнечной системы находятся почти миллиарды планет. Эти планеты известны как экзопланеты.

Итак, что такое ExoMiner и в чем заключается миссия НАСА по поиску экзопланет?

НАСА искало экзопланеты с помощью своего космического корабля Кеплер, который наблюдал почти тысячи звезд в космосе для определения возможного количества экзопланет, крадущихся вокруг. Цель космического корабля Келпера заключалась в поиске временного уменьшения яркости звезд, которое, возможно, было вызвано экзопланетой. НАСА завершило эту миссию в 2018 году, но еще есть возможность найти много данных для ученых, чтобы прочитать и открыть новые неизвестные экзопланеты. Это очень утомительная задача, и именно поэтому на сцену выходит ExoMiner.

Глубокие нейронные сети — это методы, используемые в машинном обучении. DNN (глубокие нейронные сети) автоматически изучают задачу с использованием предоставленных им данных. ExoMiner также является одной из новейших глубоких нейронных сетей, которые поддерживают суперкомпьютер НАСА, известный как Плеяды, и эта новая DNN способна отличать настоящие экзопланеты от других типов самозванцев или ложных срабатываний (что маловероятно для экзопланет). Дизайн ExoMiner был вдохновлен различными тестами и свойствами, используемыми экспертами для подтверждения новых экзопланет. Кроме того, ExoMiner учится на ранее подтвержденных экзопланетах наряду с ложноположительными случаями.

В отличие от других программ машинного обучения, обнаруживающих экзопланеты, ExoMiner не является черным ящиком — нет никакой тайны в том, почему он решает, является ли что-то планетой или нет. Мы можем легко объяснить, какие особенности данных приводят ExoMiner к отклонению или подтверждению планеты. Эти 301 открытие помогают нам лучше понять планеты и солнечные системы за пределами нашей собственной, а также понять, что делает наши планеты такими уникальными, — сказал Джон Дженкинс, ученый-экзопланетолог из Исследовательского центра Эймса НАСА в Силиконовой долине в Калифорнии.

Основное различие между подтвержденной экзопланетой и проверенной экзопланетой заключается в том, что с помощью разных методов наблюдения выявляются особенности, которые могут быть объяснены только планетой, после чего планета подтверждается. С другой стороны, планета считается подтвержденной с использованием статистики — это означает, насколько вероятно или маловероятно, что она является планетой на основе предоставленных данных.

Когда ExoMiner говорит, что что-то является планетой, вы можете быть уверены, что это планета. ExoMiner очень точен и в некотором смысле более надежен, чем существующие машинные классификаторы и эксперты-люди, которым он предназначен для подражания, из-за предубеждений, связанных с человеческими метками, сказал Хамед Вализадеган , руководитель проекта ExoMiner и менеджер по машинному обучению в Университетской ассоциации космических исследований Эймса.

Возвращаясь к 301 неизвестной и недавно обнаруженной планете, они были признаны планетами, проверенными машиной, обнаружены с помощью конвейера Kepler Science Operations Center и добавлены к статусу планет-кандидатов только с помощью ExoMiner.

Это и есть ExoMiner. Теперь, когда вы знаете об ExoMiner, давайте посмотрим на его архитектуру.

Методология ExoMiner Model

Классификация компьютеров

Поскольку модель относится к обучению с учителем в машинном обучении, идентификация метки класса с использованием предварительно помеченного обучающего набора для обучения модели называется машинной классификацией. Подходящая модель должна иметь возможность эффективно учиться на обучающих наборах данных и хорошо работать с невидимыми данными.

Первый термин из термина RHS называется смещением. Это разница между средним прогнозом модели, полученным из разных обучающих наборов, и истинным прогнозом. Высокая предвзятость вредна для учащегося, поскольку он мало учится на обучающем наборе и плохо работает как на обучающих, так и на тестовых наборах. Это также называется недообучением. Второй член RHS в приведенном выше уравнении — это дисперсия. Высокая дисперсия приводит к переобучению моделей на предоставленном обучающем наборе. Следовательно, он хорошо работает на тренировочном наборе, но плохо на тестовом наборе. Это называется переоснащением.

Хороший ученик должен хорошо работать между предвзятостью и дисперсией. От обучающего набора требуется хорошее понимание взаимосвязи между входными данными и выходными переменными. Для хорошо контролируемого алгоритма обучения требуется компромисс между двумя источниками ошибок: предвзятостью и дисперсией.

Нейронная сеть состоит из множества нейронов, нелинейных процессоров. Нейрон вычисляет взвешенную сумму всех своих входных данных, а затем передает ее нелинейной функции, называемой функцией активации, которая генерирует выходные данные.

Слои с полной связью (FC): выходные данные всех нейронов из предыдущего слоя принимаются нейроном в слое с полной связью (FC). Здесь Parametric Rectified Linear Unit (PReLU) используется в качестве функции активации для нейронов в слое FC.

Удаление слоев. Он предназначен для предотвращения переоснащения и выступает в качестве формы его регулирования. Чтобы сделать обучение модели более шумным и надежным, в этих слоях снижается процент обрабатываемых нейронов в предыдущем слое.

Одномерные (1-d) сверточные слои. Нейроны в сверточных слоях, которые называются фильтрами, работают только с небольшой частью выходных данных предыдущего слоя. Эти нейроны извлекают признаки, используя небольшие соединения областей ввода. Временные и пространственные данные являются их основным приоритетом, когда между входными данными находится информация о местоположении.

Объединение слоев: для уменьшения выборки карт объектов, созданных с помощью сверточных слоев, используются объединяющие слои.

Чтобы адаптировать и масштабировать модель DNN во всех областях и отраслях, объяснимость остается проблемой. Важно объяснить процессы, предпринимаемые моделью, чтобы прояснить внутреннюю работу модели обучения.

Ученые использовали знания предметной области для предварительной обработки и построения репрезентативных данных для подачи модели DNN, а также использовали их для определения общей архитектуры. Уникальные компоненты отчета о проверке данных использовались для предоставления их в качестве входных данных для модели DNN. К ним относятся данные о потоках с полной орбиты и транзита, звездные параметры и другие важные компоненты. Скалярные значения, которые были для каждого теста, также использовались, чтобы увидеть, эффективен ли тест. Вот некоторые из скалярных значений:

i) Скалярные признаки вторичного события

ii) Скалярные характеристики движения центроида

iii) Центроидное движение

Предлагаемая архитектура DNN для ExoMiner

Чтобы понять конкретный тип модели DNN, необходимо понять два следующих набора параметров:

  1. Общие параметры, связанные с архитектурой DNN, включают способ подачи входных данных в модель, количество блоков и слоев в модели, а также тип слоев и фильтров, используемых в модели.
  2. Конкретные переменные веса используются между нейронами.

Параметры в первом наборе определяются либо знанием предметной области, либо инструментами оптимизации гиперпараметров, либо тем и другим вместе. Модель ExoMiner DNN использует знание предметной области для определения входных данных для подачи DNN и того, как будет выглядеть ее общая архитектура. Мы можем еще больше упростить архитектуру DNN, объяснив ее с помощью приведенных ниже диаграмм.

На (рис. 2) мы видим, как и какие данные передаются в глубокую нейронную сеть. Входные данные: поток полной орбиты, поток транзитного обзора, центроид полной орбиты, центроид транзитного обзора, нечетный и четный поток транзитного обзора, вторичное затмение транзитного обзора подаются как поток входных данных, каждый в отдельную сверточную ветвь (на рис. 3.а), который сам сформировался из N блоков, и каждый блок, в свою очередь, имеет M количество сверточных слоев (рис. 3.б) плюс максимальный объединяющий слой в конце. Некоторые скалярные значения также включаются в процесс тестирования модели для обеспечения ее эффективности. Это транзитная глубина, центроидные скаляры, вторичные скаляры. Например, глубина транзита имеет решающее значение для понимания размера потенциальной планеты, потому что информация теряется в процессе нормализации данных о потоках. Позже эти скаляры и извлеченные признаки объединяются слоями FC (рис. 3.b) для создания окончательных наборов признаков. Окончательные наборы признаков, созданные слоями FC, добавляются к другим скалярным значениям (звездным параметрам и диагностическим скалярам DV) и передаются в блок FC (рис. 2), который извлекает полезную высокоуровневую информацию из всех этих диагностических тестов. -специфические особенности. Заключительный этап состоит в том, чтобы передать результат вышеописанных операций логистической сигмовидной функции, чтобы получить на выходе ноль и единицу, которые определяют, что вход является кандидатом на планету.

Эволюция производительности

Исследователи изучили производительность различных классификаторов. Эксперименты доказывают, что ExoMiner имеет меньшую изменчивость по сравнению с другими. Следовательно, ExoMiner более стабилен с точки зрения различных наборов данных.

Из приведенной выше кривой точности-отдачи видно, что ExoMiner превосходит все остальные модели с точки зрения базовых показателей, установленных для сравнения. ExoMiner имеет высокие значения отзыва при высоких значениях точности, что имеет значение при проверке новых экзопланет. При фиксированном значении точности 0,99 ExoMiner может извлечь 93,6% всех экзопланет в тестовом наборе N данные Kepler Q1-Q17 DR25.

Будущее направление ExoMiner

После этой успешной работы НАСА говорит, что есть ряд будущих направлений для улучшения производительности ExoMiner. В будущем НАСА собирается изменить архитектуру ExoMiner и включить новые важные функции, такие как:

  1. количество проходов и неопределенность в отношении глубины нечетных и четных представлений, чтобы обеспечить более эффективное использование модели ExoMiner четных и нечетных ветвей
  2. величина Кеплера, чтобы позволить модели распознавать насыщенные звезды, для которых критерий центроида недействителен.
  3. выполнить полное исследование объяснимости, используя более продвинутые методы объяснимости, и разработать структуру, которая может предоставить экспертам представление о метках и оценках ExoMiner.

Заключение

В этой статье мы узнали об экзопланетах, ExoMiner DNN, который является очень точным NN для подтверждения и проверки новых экзопланет, его архитектуры и нового открытия НАСА о 301 неизвестной экзопланете. Надеюсь, вам понравилась эта статья!

Рекомендации









Ознакомьтесь с официальной статьей НАСА об ExoMiner здесь.

Соавторы: Прадунья Маладхари, Талиб Хуссейн и Гитанджали Сурьяванши