Detección rápida de supernovas mediante redes neuronales

¡Hola, Habr! Me gustaría presentarles una traducción (ligeramente adaptada) del excelente artículo "Detección rápida de supernovas mediante redes neuronales" de Rodrigo Carrasco-Davis del Instituto de Astrofísica de Chile.



Un poco de historia



La astronomía es el estudio de los objetos celestes: estrellas, galaxias o agujeros negros. Este estudio de los objetos celestes se asemeja al trabajo en el laboratorio de "física natural". En él tienen lugar los procesos naturales más increíbles y extremos, que en su mayor parte no se pueden repetir en la Tierra. Las observaciones de estos procesos nos permiten obtener una comprensión más profunda del mundo, comprobar los conocimientos existentes sobre física, comparando las ideas establecidas con lo que observamos en el Universo.



Existe un tipo especial de evento que es de gran interés para los astrónomos. Ocurre al final de la vida de las estrellas masivas. Están compuestos de hidrógeno, que es atraído hacia el centro por la gravedad. Y cuando la densidad aumenta lo suficiente, los átomos de hidrógeno comienzan a fusionarse. Esto conduce a la aparición de un resplandor y la aparición de nuevos elementos químicos: helio, carbono, oxígeno, neón, etc. El proceso de fusión tiene lugar bajo presión interna, mientras que la gravedad ejerce una presión externa, manteniendo así la estabilidad de la estrella mientras se quema. Cuanto más masiva es la estrella, las temperaturas más altas alcanzan su núcleo y más rápido quema el combustible nuclear.



Poco a poco, el proceso de síntesis pasa a los elementos más pesados: al magnesio, silicio, azufre, llegando finalmente al hierro, cobalto y níquel. La síntesis de más elementos requeriría más energía de la que se libera durante la reacción, por lo que el núcleo colapsa y se produce una explosión de supernova.





Nebulosa del Cangrejo , Remanente de Supernova



Este proceso es muy importante para los astrónomos. Debido a las condiciones extremas durante la explosión, los astrónomos pueden observar la síntesis de elementos pesados, comprobar el comportamiento de la materia bajo presión y temperatura intensas y observar el producto de la explosión, que podría ser una estrella de neutrones o un agujero negro.



Las supernovas también se pueden utilizar como velas estándar. Un problema común en astronomía: medir distancias a objetos celestes. Dado que las estrellas están tan lejos de la Tierra, es difícil determinar si una estrella es débil y cercana a nosotros, o muy distante y muy brillante. La mayoría de las explosiones de supernovas en el Universo ocurren de la misma manera, por lo que los astrónomos usan supernovas para medir distancias, lo cual es importante al estudiar, por ejemplo, la expansión del Universo y la energía oscura .



A pesar de que las explosiones de supernova son muy brillantes, son difíciles de notar debido a su distancia a la Tierra, debido a su baja frecuencia de ocurrencia (alrededor de una supernova por galaxia por siglo) y la naturaleza de corto plazo de la explosión, que puede durar desde varios días hasta un par. semanas. Además, para obtener información útil de una supernova, es necesario preparar un espectrógrafo (utilizado para medir la energía emitida durante una explosión en varias frecuencias). También sería bueno comenzar a observar la estrella antes de tiempo, ya que muchos procesos físicos interesantes tienen lugar pocas horas después de la explosión. Ahora hágase una pregunta: ¿cómo podemos encontrar rápidamente estas explosiones de supernovas entre todos los demás objetos astronómicos observables en el universo?



Astronomía hoy



Hace varias décadas, un astrónomo tuvo que seleccionar un objeto específico y apuntarle con un telescopio para obtener la información que necesitaba. Telescopios modernos como el Zwicky Transient Facility (ZTF) o el Observatorio Vera Rubin capturan imágenes de alta calidad del cielo a una velocidad muy alta, recopilando datos del cielo visible cada tres días. El telescopio ZTF genera 1,4 TB de datos por noche, identificando y enviando información sobre interesantes objetos cambiantes en el cielo en tiempo real.



Cuando algo cambia su brillo, los telescopios "inteligentes" lo notan y envían una alerta-advertencia. La advertencia se logra enviando un flujo de datos en el que cada mensaje consta de tres imágenes recortadas de 63 por 63 píxeles. Estas tres imágenes se denominan científicas, de referencia y diferenciales.



Un archivo de imagen científica es la observación más reciente de un área específica. Con referencia, lo que estaba al comienzo de las observaciones. Todo lo que ha cambiado entre la primera y la segunda imagen se puede ver en la tercera, diferencia. El notorio telescopio transmite hasta un millón de avisos por noche, pero más a menudo varios miles. Digamos que una persona quiere verificar cada alerta manualmente, tomará alrededor de 3.5 días ver todas las alertas en una noche.





Imágenes científicas, de referencia y de diferencia. Complementado con otros datos importantes, como condiciones de observación e información sobre el objeto. La cuarta imagen es una versión en color de PanSTARRS que utiliza Aladin Sky Atlas . Puede ver la evolución completa del brillo de las supernovas a lo largo del tiempo en la interfaz ALeRCE .



Dado que estas advertencias comunican todo lo que cambia en el cielo, es importante poder detectar supernovas entre todo el flujo de información generado por el telescopio. El problema es que otros objetos astronómicos también pueden activar una alerta. Por ejemplo, estrellas variables que cambian su brillo, núcleos galácticos activos, asteroides. También hay falsas advertencias. Afortunadamente, las imágenes científicas, de referencia y de diferencia tienen una serie de características distintivas que ayudan a determinar de qué se está hablando una alerta sobre una supernova u otro objeto. Y sería fantástico aprender a distinguir eficazmente entre las principales clases de alertas.





Cinco clases de objetos astronómicos



Por lo tanto, los núcleos galácticos activos suelen estar ubicados en el centro de las galaxias. Las supernovas suelen originarse cerca de la galaxia anfitriona. Los asteroides se observan cerca del sistema solar y no son visibles en la imagen de referencia. Las estrellas variables se encuentran en imágenes llenas de otras estrellas, ya que se encuentran principalmente dentro de la Vía Láctea. Las falsas alertas surgen por diversos motivos: falta de píxeles en la cámara del telescopio, mala sustracción al crear una imagen diferencial, rayos cósmicos, etc. Como dije antes, no es posible que un humano revise manualmente cada advertencia. Por lo tanto, se necesitaba una forma automática de clasificarlos para que los astrónomos pudieran encontrar los datos más interesantes, que es más probable que contengan información sobre supernovas.



Búsqueda de supernovas mediante redes neuronales



Dado que entendemos aproximadamente las diferencias entre las imágenes de las cinco clases mencionadas anteriormente, podemos intentar calcular características específicas para clasificarlas correctamente. Sin embargo, el trabajo manual es difícil y requiere un largo período de prueba y error. Por lo tanto, se decidió entrenar una red neuronal convolucional (CNN) para resolver el problema de clasificación y detectar supernovas rápidamente.



Asegurar la invariancia de la red neuronal se logra creando copias rotadas de cada imagen en el conjunto de entrenamiento en 90 °, después de lo cual se carga el valor promedio de cada versión rotada de la imagen. El uso de la invariancia es importante porque no existe una orientación específica en la que puedan aparecer estructuras en las imágenes enviadas en alertas.



Los científicos también agregaron algunos de los metadatos contenidos en la advertencia, como la posición en las coordenadas del cielo, la distancia a otros objetos conocidos y métricas de las condiciones atmosféricas. Después de entrenar el modelo usando entropía cruzada, la probabilidad de que la advertencia contenga información sobre una supernova se concentra alrededor de los valores de 0 o 1. Es cierto, el clasificador a veces se equivoca en la clase predicha. No es muy conveniente que el investigador tenga que filtrar adicionalmente los datos sobre posibles supernovas después de que la computadora haya hecho una predicción.



Para maximizar la entropía del pronóstico y distribuir los valores de las probabilidades de salida, los científicos agregaron información adicional a la red neuronal. Esto permitió mejorar el detalle o claridad de los pronósticos, obteniendo probabilidades en todo el rango de 0 a 1, y no solo los valores extremos de estos indicadores. El resultado son predicciones mucho más fáciles de interpretar, lo que permite al astrónomo seleccionar candidatos dignos de supernova.





Red neuronal convolucional con mayor invariancia de rotación. Las copias rotadas se crean y pasan a la misma arquitectura de red neuronal para luego aplicar el grupo intermedio en una capa densa antes de combinar con los metadatos.



Los científicos pasaron por la red neuronal unos 400.000 objetos, distribuidos uniformemente en el espacio a lo largo de toda la cobertura del telescopio ZTF, como comprobación de la exactitud de las predicciones del modelo. Resultó que cada clase predicha por la red neuronal está distribuida espacialmente. Esto tiene sentido cuando se considera la naturaleza de cada objeto astronómico. Por ejemplo, los núcleos galácticos activos y las supernovas se encuentran principalmente fuera del plano de la Vía Láctea (objetos extragalácticos), ya que es poco probable que se puedan ver más objetos a través del plano de la Vía Láctea debido a la oclusión. El modelo predice correctamente menos objetos cerca del plano de la Vía Láctea (latitudes galácticas más cercanas a 0). Las estrellas variables se detectan correctamente con mayor densidad en el plano galáctico. Los asteroides se encuentran cerca del plano del sistema solar,también llamada eclíptica (marcada con una línea amarilla). Y las falsas advertencias ocurren en todas partes.



La información de las imágenes (científica, de referencia y diferencia) es suficiente para obtener una buena clasificación en el conjunto de entrenamiento, pero la integración de la información de los metadatos fue fundamental para obtener la correcta distribución espacial de las predicciones. 





Distribución espacial de un conjunto no marcado de objetos astronómicos. Cada gráfico se da en coordenadas galácticas. La latitud galáctica está en el centro de la Vía Láctea, por lo que las latitudes cercanas a 0 también están más cerca del plano de la Vía Láctea. La longitud galáctica indica cuánto del disco vemos en el plano de la Vía Láctea. La línea amarilla representa el plano del sistema solar (eclíptica).



Cazadores de supernovas



La interfaz web del proyecto Supernova Hunter resultante permite a los astrónomos estudiar objetos seleccionados por la red neuronal, confiando en que son supernovas. También pueden informar sobre clasificaciones erróneas realizadas por el modelo, lo que permite agregar nueva información al conjunto de entrenamiento para mejorar el rendimiento de la red neuronal más adelante.





Supernova Hunter : interfaz de usuario para investigar candidatos a supernova. Muestra una lista de alertas con alta probabilidad de información de supernova. Para cada uno de ellos se agregan imágenes, posición del objeto y metadatos.



El clasificador de redes neuronales y Supernova Hunter confirmaron 394 supernovas e informaron 3.060 candidatos a supernovas en Transient Name ServerDesde el 26 de junio de 2019 hasta el 21 de julio de 2020, se lanzaron un promedio de 9.2 candidatos a supernova por día. Esta tasa de observación aumenta drásticamente el número de supernovas disponibles que se pueden estudiar en las primeras etapas de una explosión.



Perspectivas



Los científicos detrás del Supernova Hunter ahora están trabajando para mejorar las características de clasificación del modelo para que identifique con mayor precisión a los candidatos a supernova y requiera menos atención humana. Idealmente, este debería ser un sistema que pueda informar automáticamente sobre todos los posibles candidatos a supernova con un alto grado de confianza.



Otra área de trabajo de los científicos es la búsqueda de objetos raros utilizando métodos de detección de valores atípicos. Esta es una tarea desafiante pero realista, ya que los nuevos telescopios teóricamente podrían descubrir nuevos tipos de objetos astronómicos debido a la increíble frecuencia de muestreo y la escala de cada observación.



Una nueva forma de analizar grandes cantidades de datos astronómicos no solo será útil, sino también necesaria, ya que organizar la clasificación y redistribución de datos es una parte importante de la ciencia. El uso de telescopios modernos y potentes está cambiando fundamentalmente la forma en que los astrónomos estudian los objetos celestes, y los científicos deben estar preparados para trabajar con nuevas tecnologías.



¡Gracias por su atención! Articulo original .



All Articles