El uso en el negocio de métodos relacionados con la transformada discreta de Fourier tiene un potencial significativo. Un factor limitante para la realización de este potencial es una alta barrera de entrada metodológica.
El enfoque principal del trabajo:
- requisitos de datos para una correcta aproximación de Fourier de series de tiempo;
- la validez de las expectativas de los pronósticos;
- un pequeño conjunto de armónicos es suficiente para aproximar una serie compleja;
- qué es un evento de Fourier;
- cómo y cómo los eventos de Fourier pueden ayudar a las empresas;
- Eventos de Fourier en el análisis de flujo de caja.
1. Pronóstico
La tarea fue establecida por un gran transportista marítimo y se refería a las previsiones de los precios del flete por tipo de barco. El transportista tenía una serie de suscripciones a pronósticos de empresas analíticas internacionales, pero la calidad de los pronósticos no le convenía. Las empresas analistas utilizaron regresión múltiple, tenían estadísticas a largo plazo y aumentaban continuamente la dimensión de sus modelos. Al mismo tiempo, ellos mismos admitieron un porcentaje bastante alto de errores en sus pronósticos.
El criterio para evaluar el éxito del nuevo pronóstico fue el siguiente: se da un fragmento de datos históricos, se forma un pronóstico y se calcula la precisión del pronóstico del futuro ya cumplido. La agitación se convirtió inmediatamente en un claro problema metodológico. Si Estados Unidos no vendió petróleo en absoluto hasta 2017 y luego se convirtió inmediatamente en un líder, entonces, ¿cómo puede esto afectar las conclusiones basadas en datos históricos? Otros eventos: guerras, crisis, - desde el punto de vista del pronóstico, son esencialmente los mismos eventos, pero la situación con las exportaciones de petróleo de los Estados Unidos es extremadamente indicativa para descartar el factor de evento en la metodología de pronóstico (las ponderaciones producen linealidad y los eventos producen una brecha y singularidad) ...
Se han probado muchos métodos. La más interesante fue la aproximación de series de Fourier (aproximación de Fourier) de series temporales y su estudio desde el punto de vista de la previsión empresarial. Al mismo tiempo, hubo un problema técnico: todo el tiempo hubo un cambio en la aproximación de la serie original.
2. Formación de datos para la transformada de Fourier
Explicaciones preliminares necesarias.
La transformada discreta de Fourier se aplica a vectores que constan de valores reales. Si una serie de tiempo se ve como un conjunto de <tiempo-valor> puntos, entonces la transformada de Fourier se aplica a un vector de una secuencia de valores de serie de tiempo.
Existen sutilezas en el uso de la transformada de Fourier, que están asociadas con el número de valores y características de los espacios entre ellos. Por ejemplo, la serie de tiempo original puede tener intervalos desiguales o valores faltantes para ciertas posiciones de tiempo (fines de semana, días festivos).
En muchos casos, el siguiente procedimiento es útil. Primero se interpola la serie de tiempo original y luego se toma de la función interpolada el número requerido de valores en las posiciones de tiempo deseadas. Por lo tanto, la serie de tiempo original se reemplaza por una serie regular más frecuente con el número requerido de valores interpolados.
El siguiente es el enfoque descrito por A. Dieckmann.
Transformada discreta de Fourier.
Un vector de valores reales u = u [r] se transforma en un vector de valores complejos f [s] usando la siguiente fórmula (hay varias fórmulas para F [s, r] que dan resultados equivalentes): f [s] = u [r] * F [s, r], donde
y los valores de s, r varían de 1 a n.
Datos necesarios para la obtención del espectro de Fourier.
El vector resultante f [s] puede interpretarse como un espectro de Fourier, ya que contiene información sobre las amplitudes, frecuencias y fases de los armónicos fundamentales.
Además, existen requisitos para u [r]. Los valores de u [r] deben especificarse en los puntos de división del intervalo cuando el intervalo tiene la longitud de un número entero de pasos del mismo tamaño. El valor r corresponde a la posición (índice) en el vector. En general, r define una posición en el tiempo (serie temporal) o en el espacio (en otras dimensiones).
Suponga que el vector u [r] debe definirse en el intervalo [tMin, tMax], cuya longitud es tt = (tMax-tMin). Sea delta = tt / n la distancia entre puntos adyacentes del intervalo, en el que se calcula u [r].
Consideremos qué proceso debería tener lugar técnicamente.
El exponencial complejo en la matriz F [s, r] se puede interpretar como una sonda vectorial (depende de s) que gira en el plano complejo con una frecuencia (s-1) / tt y se mueve secuencialmente (en tiempo o espacio) a lo largo de (r- 1) * tt / n. Durante la multiplicación de matrices, el vector de sonda correspondiente a r se multiplica por el u [r] específico, y la suma del vector se calcula sobre todo r, dando el número complejo f (s). Y así se repite para todos los s desde 1 hasta n. Cada f [s] indica la presencia o ausencia de un componente que oscila a la frecuencia asociada con s.
¿Cómo debería formarse u [r]?
En este punto, la serie de tiempo original debe interpolarse y mostrarse en el intervalo seleccionado, un múltiplo de un número entero de pasos. Se elige empíricamente un número suficiente de puntos para una aproximación precisa.
En esta etapa, lo principal es cuántos puntos tomar y cuáles. El valor de n se fija en delta. En este caso, tenemos un conjunto de n + 1 puntos para todos los valores de la partición de intervalo.
En u = u [r] es necesario incluir puntos solo del primero al último, pero uno, pero no el último: solo n.
De lo contrario, la aproximación de Fourier se desplazará ligeramente con respecto a la serie de tiempo original.
3. Interpretación visual de las transformadas de Fourier
Para el uso generalizado de la transformada de Fourier en la práctica, es necesario sentir lo que da además de fórmulas complejas y formar correctamente los datos iniciales.
Considere cómo actúa la transformada de Fourier sobre una función sinusoidal. Para ello, es útil combinar en un gráfico el comportamiento de la función y las características que da la transformada de Fourier en puntos específicos y en general sobre la función en estudio.
Considere la función 1 + Sin [2πx] en el segmento [0, π].
La amplitud de esta función corresponde a 1Hz, ya que repite su movimiento después de 2 π.
Sea n = 20, luego, al dividir el intervalo en partes iguales, puede obtener 21 valores en los puntos correspondientes de la división. Pero, siguiendo la explicación anterior, operaremos con solo 20 puntos, sin el último (solo negro en la imagen de arriba).
El parámetro r avanza a lo largo de la abscisa y tiene 20 valores. El parámetro s define la velocidad en (s-1) Hz.
Las siguientes figuras muestran la rotación del vector de la sonda. Cada sonda vectorial comienza en el punto u [r], para el cual se calcula el valor F [s, r]. Los parámetros del final del vector sonda se obtienen como sigue: la abscisa es el producto u [r] * Re [F [s, r]], la ordenada es u [r] * Im [F [s, r]].
Para mayor claridad, se ha seleccionado una paleta de vectores de sonda en movimiento de principio a fin. Comienza de marrón, luego de verde a azul: las
figuras siguientes muestran la rotación del vector de la sonda reducido al punto en el gráfico para el cual se calculó la transformada de Fourier, así como la ruta (suma del vector) cuando los vectores de la sonda adyacentes son directamente adyacentes.
El eje de ordenadas muestra la amplitud de la función original y la parte imaginaria de la transformada de Fourier.
El eje de abscisas es la posición del punto en los intervalos de tiempo de la función original y la parte real de la transformada de Fourier.
La suma de los vectores muestra la configuración del movimiento de los vectores de la sonda. El punto negro denota el inicio del movimiento y el final del movimiento (otro punto negro si no coinciden). Para s = 3, el inicio y el final son iguales. Para s = 1 y s = 2, el inicio y el final no coinciden.
Las coordenadas de inicio y final se muestran por separado, así como valores redondeados (muy cercanos a cero).
El valor s caracteriza la frecuencia probada.
Hay simetría en el comportamiento.
El centro es s = 11.
Como ejemplo de simetría, daremos las cifras para s = 19 y s = 20, que son simétricas a s = 3 y s = 2.
¿Qué pasa si no sacas 20 puntos, sino 21, incluido el último? Ejemplo para s = 3. Muestra la presencia de un componente que oscila con una frecuencia asociada con s = 3, mientras que no existen tales oscilaciones en la función original. Solo hay una fluctuación de 1 Hz en la función original.
Todas las gráficas anteriores están destinadas a mostrar la importancia de dividir correctamente los intervalos y los datos de muestreo para estos intervalos sin el último valor. Sólo en este caso habrá una correcta aproximación de Fourier de la serie original y la posibilidad de su continuación periódica.
El resto de los aspectos de la aproximación de Fourier se presentan en la bibliografía de referencia de forma bastante completa.
4. Análisis de series en tiempo real
Volvamos a la tarea que se describió al principio.
La siguiente es una aproximación de Fourier de los datos históricos sobre los precios de los barcos para el envío.
En cada imagen del primer bloque de la izquierda, hay un gráfico que muestra a qué nivel de valores de amplitud (línea de puntos rojos) se cortan los armónicos que hacen una contribución insignificante. El primer bloque de la derecha muestra las características de los primeros 10 armónicos de la serie aproximada en amplitud decreciente.
El segundo bloque consta de gráficos con el aumento del número de armónicos (en orden desde la mayor amplitud) utilizados para la aproximación. El resultado de la aproximación es una línea punteada roja.
Para una serie de tiempo dada, 5 armónicos son suficientes.
Para esta serie de tiempo, puede limitarse a 5 armónicos, si no considera que los datos muy antiguos sean demasiado importantes.
Esta serie de tiempo está bastante bien aproximada por los octavos armónicos.
En este caso, es conveniente considerar 11 armónicos.
Por lo tanto, los datos históricos en un campo de actividad bastante dinámico (precios de los barcos para el transporte marítimo) pueden aproximarse bien con un promedio de 10 armónicos.
En general, el problema de la predicción, cuando el futuro ya existente se reconstruye a partir de un fragmento de datos históricos con algún error, puede considerarse resuelto si se conocen los armónicos fundamentales (algunos) de la aproximación.
Al mismo tiempo, está claro que el pronóstico para el futuro que dará la aproximación de Fourier será, de hecho, completamente erróneo: esto se hace evidente debido al mecanismo transparente para construir la aproximación de Fourier.
Con regresión múltiple, cuando hablamos del 70% de la confiabilidad del pronóstico, todo es igual, pero el mecanismo de construcción opaca nos permite esperar irracionalmente que, en general (70%), el pronóstico será correcto.
5. Eventos de Fourier
Los eventos de Fourier surgen bajo el supuesto de que tienen lugar procesos cíclicos básicos (armónicos), que se superponen y combinan con eventos importantes, también representados por armónicos.
Así, todos los armónicos de la aproximación de Fourier se dividen en dos partes: los armónicos básicos del proceso y los armónicos de los eventos. Es importante recordar que la suma de los armónicos básicos y de eventos proporciona una aproximación adecuada de la serie original.
En este caso, para una buena previsión, basta con conocer los ciclos básicos y tener una lista de eventos y circunstancias, según la cual se debe formar una previsión continua en base a los eventos esperados o ya ocurridos o sus cadenas. Pero esta es una tecnología de pronóstico ligeramente diferente, no tradicional.
Los dos métodos siguientes para corregir eventos de Fourier están justificados metodológicamente.
El primer método está asociado con la resta de la serie de tiempo completa de todas las posibles combinaciones de armónicos que la aproximan y la comparación de eventos conocidos con los extremos o desviaciones estables resultantes. Dado que casi todas las industrias tienen empresas analíticas que recopilan estadísticas y revisan las tendencias (en algunas industrias incluso semanalmente), encontrar eventos importantes para una fecha no es un problema lo suficientemente difícil.
El segundo, llamémoslo el método de división, está asociado con dividir la serie de tiempo completa en períodos de diferentes longitudes y buscar períodos "similares" por armónicos comparables. Con el enfoque descrito para la aproximación de Fourier, dicha tarea se puede automatizar completamente.
El método de división es cualitativamente diferente del primer método, ya que existe una operación no lineal para la división completa de aislar su tendencia (regresión lineal) de cada componente de la división seleccionada.
6. Análisis de datos de los precios del petróleo mediante eventos de Fourier
Por ejemplo, considere los precios del petróleo Europa Brent Precio al contado FOB. Fuente: Thomson Reuters. Administración de Información Energética de EE. UU. Thomson Reuters. Los datos están expresados diariamente en dólares estadounidenses desde el 20 de mayo de 1987 hasta el 10 de noviembre de 2020.
Serie temporal original.
Seleccionamos una tendencia - regresión lineal.
Eliminamos los datos iniciales de la tendencia (siempre se puede restaurar una tendencia lineal).
Gráfico azul - datos brutos. El negro es tendencia. Naranja: datos normalizados (sin tendencia).
Encuentra una aproximación.
Hasta ahora, no todo es muy bueno: los armónicos octavo y vigésimo para tal serie no serán suficientes.
Para 30 armónicos, el resultado es bastante aceptable.
Pasemos al método de aislar eventos de Fourier. Ilustremos uno de los enfoques para el caso de aproximación de la serie original por octavos armónicos.
Encuentre todas las combinaciones posibles de 8 armónicos. Habrá 255 de ellos. Para cada una de 255 combinaciones, calculamos el valor absoluto a partir de la diferencia de puntos entre la fila original y la estructura (fila) generada por una combinación específica de armónicos.
Para una nueva serie, calculamos el máximo, la desviación estándar y la suma total de valores (es posible que sea necesario calcular otros indicadores: media, etc.).
En las figuras, estos indicadores se muestran de forma secuencial. Corresponden a los primeros cien valores, ordenados en orden descendente de máximo.
Consideremos los primeros 60 de los 100 seleccionados. Y luego elegiremos los (visualmente) interesantes. Los gráficos se muestran a continuación. El número debajo de la imagen corresponde al número ordinal de la combinación de 255. El gráfico gris es la fila original, la fila roja es de la combinación de armónicos.
Lo que cuenta como "interesante" es una tarea significativa para una empresa. Todo lo que ha estado ahí hasta ahora es solo una técnica estándar.
¿Que pasó al final? A partir de un conjunto de armónicos que se aproximan bien a la serie original, hemos seleccionado combinaciones que en algunas zonas se corresponden muy bien con la serie temporal original, y en otras muestran una clara discrepancia. Son los últimos sitios los que son candidatos para el análisis de eventos ocurridos durante este período (todos los gráficos son diarios con una fecha explícita).
Además, la presencia de áreas muy bien contiguas de los gráficos proporciona una base para derivar las características de la "norma" para la dinámica de los procesos reflejados.
El objetivo del análisis es identificar armónicos que corresponden a eventos. El problema inverso es la selección de procesos cíclicos básicos.
El método de división es importante porque el proceso representado por una serie de tiempo puede ser esencialmente compuesto y depender de eventos de un orden superior: una crisis global, etc.
7. Eventos de Fourier en el análisis de la corriente de efectivo
El proceso de análisis de una serie temporal está asociado a la expectativa de que dominen los procesos cíclicos. En general, estas expectativas pueden no cumplirse. Ni siquiera se trata de que no exista tal dominio de la ciclicidad. Simplemente debido a la forma particular en que se forma la serie de tiempo, puede que no sea posible identificar la ciclicidad en esa serie en particular.
El flujo de caja es otro asunto. De hecho, la actividad productiva y comercial, la mayoría de los procesos son inicialmente cíclicos en la forma en que se forman. Las desviaciones de la norma están asociadas con eventos que alteran este carácter cíclico. El uso del método de eventos de Fourier en el análisis del flujo de caja permite identificar una “norma” objetiva, así como indicadores de desviaciones.
En términos de eventos de Fourier, el problema del análisis del flujo de efectivo es bien algorítmico para aplicar métodos de inteligencia artificial y redes neuronales (aprendizaje automático).