Cómo se enseñó a la inteligencia artificial a resolver la difusión

Hoy, en vísperas del inicio de una nueva corriente del curso "Matemáticas y aprendizaje automático para la ciencia de datos" , compartimos con ustedes una útil traducción de un artículo de MIT Technology Review sobre cómo los investigadores de Koltech enseñaron a la IA a resolver ecuaciones diferenciales parciales, por qué es necesario y cómo puede cambiar el mundo. ... Puedes encontrar todos los detalles debajo del corte.










A menos que sea físico o ingeniero, no tiene ninguna razón particular para conocer las ecuaciones diferenciales parciales. Y después de años de estudios de posgrado en ingeniería mecánica, no los he usado en la vida real desde entonces.



Pero tales ecuaciones (de aquí en adelante usaremos la abreviatura en inglés PDE para simplificar), tienen su propia magia. Esta es una categoría de ecuaciones matemáticas que son realmente buenas para describir cambios en el espacio y el tiempo y, por lo tanto, muy convenientes para describir fenómenos físicos en nuestro universo. Se pueden usar para modelar todo, desde órbitas planetarias hasta placas tectónicas y turbulencias del aire que interfieren con el vuelo, lo que a su vez nos permite hacer cosas útiles, como predecir la actividad sísmica y diseñar aviones seguros.



El problema es que los PDE son notoriamente difíciles de resolver. Y aquí quizás se ilustra mejor el significado de la palabra "decisión". Por ejemplo, está intentando simular turbulencias de aire para probar un nuevo diseño de avión. Existe una PDE muy conocida llamada ecuación de Navier-Stokes, que se utiliza para describir el movimiento de cualquier fluido. Resolver la ecuación de Navier-Stokes le permite tomar una "instantánea" del movimiento del aire (condiciones del viento) en cualquier momento y simular cómo continuará moviéndose o cómo se movió antes.



Estos cálculos son muy complejos y computacionalmente costosos, por lo que las disciplinas con muchas PDE a menudo se basan en supercomputadoras para realizar cálculos matemáticos. Es por eso que los profesionales de la inteligencia artificial se interesan especialmente en estas ecuaciones. Si pudiéramos utilizar el aprendizaje profundo para acelerar la solución, podría haber muchos beneficios en investigación e ingeniería.



Los investigadores de Koltech presentan una nueva técnica de aprendizaje profundopara resolver PDE, que es significativamente más preciso que los métodos de aprendizaje profundo desarrollados anteriormente. El método también está lo suficientemente generalizado como para resolver familias completas de PDE, como la ecuación de Navier-Stokes, para cualquier tipo de fluido, sin la necesidad de un nuevo entrenamiento. Finalmente, es 1.000 veces más rápido que las fórmulas matemáticas tradicionales, lo que reduce la dependencia de las supercomputadoras y aumenta aún más el poder computacional del modelado de problemas. Y esto es bueno. ¡Dale dos!



Hora del martillo



[aprox. transl. - Subtítulo: un guiño a "U Can't Touch This" del rapero MC Hammer]



Antes de sumergirnos en cómo lo hicieron los investigadores, primero evaluemos los resultados. El siguiente gif muestra una demostración impresionante. La primera columna muestra dos instantáneas del movimiento de fluidos; la segunda columna muestra cómo el fluido realmente continuó moviéndose; y la tercera columna muestra la predicción de la red neuronal. Básicamente parece idéntico al segundo.







El artículo hizo mucho ruido en Twitter e incluso el rapero MC Hammer lo volvió a publicar.







Pero volvamos a cómo los científicos lograron esto.



Cuando la función encaja



Lo primero que hay que entender es que las redes neuronales son básicamente aproximaciones. Cuando entrenan en un conjunto de entradas y salidas, en realidad están calculando una función o una serie de operaciones matemáticas que traducen un dato en otro. Considere un detector de gatos. Entrena la red neuronal alimentándola con muchas imágenes de gatos y otras imágenes, marcando los grupos como 1 y 0. Luego, la red neuronal busca la mejor función que convierte cada imagen del gato en 1, y las imágenes de todo lo demás en 0. Entonces la red puede mirar la imagen y Dile si tiene un gato. Ella usa la función encontrada para calcular su respuesta, y si el entrenamiento fue exitoso, en la mayoría de los casos el reconocimiento será correcto.



Convenientemente, la aproximación de funciones es exactamente lo que necesitamos al resolver PDE. En última instancia, necesita encontrar una función que describa mejor, digamos, el movimiento de las partículas de aire en el espacio y el tiempo.



Ésta es la esencia del trabajo. Las redes neuronales generalmente se entrenan para aproximar funciones entre entradas y salidas definidas en el espacio euclidiano, este es un gráfico clásico con los ejes x, y y z. Pero esta vez, los investigadores decidieron definir las entradas y salidas en el espacio de Fourier, un tipo especial de espacio para trazar las frecuencias de las ondas. El hecho es que algo como el movimiento del aire en realidad puede describirse como una combinación de ondas, dice Anima Anandkumar, profesora de la Universidad de California, quien, junto con sus colegas, los profesores Andrew Stewart y Kaushik Bhattacharya, dirigieron la investigación. La dirección general del viento en el nivel macro es similar a la de baja frecuencia con ondas muy largas y lentas, mientras que los pequeños remolinos generados en el nivel micro son similares a las frecuencias altas con ondas muy cortas y rápidas.



¿Por qué es esto tan importante? Porque es mucho más fácil aproximar una función de Fourier en el espacio de Fourier que tratar con PDE en el espacio euclidiano. Este enfoque simplifica enormemente el trabajo de la red neuronal. Esto también es una garantía de una mejora significativa en la precisión: además de la gran ventaja de velocidad sobre los métodos tradicionales, el nuevo método reduce la tasa de error en la resolución de problemas de Navier-Stokes en un 30% en comparación con los métodos de aprendizaje profundo anteriores.



Todo esto es muy razonable y, además, el método tiene la capacidad de generalizar. Los métodos anteriores de aprendizaje profundo deben entrenarse por separado para cada tipo de fluido, en el caso de este método, un entrenamiento es suficiente para hacer frente a todos los fluidos, lo cual es confirmado por los experimentos de los investigadores. Si bien aún no han intentado extender el enfoque a otros medios, el método también debería ser capaz de trabajar con la corteza terrestre al resolver PDE relacionadas con sísmica o con tipos de materiales al resolver PDE relacionadas con la conductividad térmica.



Supersimulación



La facultad y sus estudiantes graduados hicieron esta investigación por algo más que el placer de las teorías. Quieren llevar la IA a nuevas disciplinas científicas. Fue gracias a las conversaciones con empleados de diversos perfiles que trabajan en los campos de la climatología, la sismología y la ciencia de los materiales que Anandkumar fue la primera en resolver el problema PDE junto con sus colegas y estudiantes. Ahora están trabajando para poner en práctica el método con colegas investigadores de Coltech y Lawrence Berkeley National Laboratory.



Uno de los temas de investigación que más preocupa a Anandkumar es el cambio climático. La ecuación de Navier-Stokes es muy adecuada no solo para modelar la turbulencia del aire; esta ecuación también se utiliza en modelos meteorológicos. "Los pronósticos meteorológicos globales buenos y precisos son un desafío", dice, "e incluso en las supercomputadoras más grandes, no podemos hacer pronósticos globales hoy". Por lo tanto, si podemos utilizar un nuevo método para acelerar todo el trabajo, tendrá un gran impacto.



“Hay muchas, muchas otras aplicaciones del método”, agrega. "En ese sentido, no hay límite, porque tenemos una forma común de acelerar el trabajo con todas estas aplicaciones".



Ahora que la inteligencia artificial puede resolver la difusión, ¿qué sigue? Quizás seas uno de los que le enseñarán a resolver problemas aún más complejos.

Y estaremos encantados de ayudarle con esto presentando un código promocional especial HABR , que añadirá un 10% al descuento del banner.



imagen




Más cursos




Artículos recomendados






All Articles