Características de la clase considerada de problemas de análisis de datos
Es necesario investigar una serie de tiempo multidimensional bajo las siguientes condiciones:
- La complejidad del proceso registrado y (o) la singularidad de las tareas de investigación no permiten reducir el trabajo al uso de un algoritmo listo para usar. Se hace necesario dividir el proceso en etapas y analizar la compleja dinámica dentro de cada una de ellas. Los criterios para delimitar las etapas no son tan obvios para ser aplicados sin visualización de datos.
- Los parámetros son de diferente naturaleza física y se miden en diferentes unidades. Cada curva de serie de tiempo necesita su propia escala de ordenadas.
Características del trabajo desde el punto de vista del entorno de visualización de datos.
Dividir una serie temporal en etapas puede ser trivial y bastante complejo. Hay casos en los que los límites de los pasos del proceso se pueden determinar, por ejemplo, por el valor de la variable de estado. Esta tarea se puede resolver sin visualización, por ejemplo, utilizando filtros de datos en MS Excel .
La identificación de límites en casos más complejos se asocia con una búsqueda visual en los gráficos de signos más o menos objetivos de la transición del sistema a un nuevo estado. Al mismo tiempo, la elección de los criterios puede requerir que un especialista comprenda el área temática y realice cálculos adicionales.
Cabe señalar que incluso con la división más simple de la serie de tiempo en etapas, un conocimiento preliminar de los gráficos tiene un significado práctico. Como mínimo, esta acción le permite asegurarse de que no haya defectos obvios en la grabación antes de comenzar a trabajar.
Ni siquiera tocaremos superficialmente los métodos utilizados para analizar la dinámica del proceso dentro de los límites de una etapa separada. Es importante que, para muchos problemas, el análisis requiera una mayor división de la serie y la consideración de intervalos de tiempo más pequeños dentro de las etapas principales. Además, los intervalos de tiempo de las transiciones entre etapas pueden ser de interés.
Por lo tanto, cuando se resuelven problemas de la clase en consideración, generalmente se requiere cambiar el intervalo de tiempo en los gráficos muchas veces (el recuento puede llegar a cientos). La calidad de la implementación de esta acción en la interfaz de usuario del entorno de procesamiento de datos afecta significativamente la eficiencia del trabajo.
Sistemas existentes
MS Excel le permite construir una serie de tiempo multidimensional con dos escalas a lo largo del eje de ordenadas ("eje auxiliar"). Al mismo tiempo, el cambio de los límites izquierdo y derecho en el eje de abscisas se realiza mediante un impresionante conjunto de acciones, incluida la introducción de números desde el teclado.
Después de confirmar los cambios, ninguna de las escalas de ordenadas cambia su configuración. Para el intervalo de tiempo modificado, las escalas anteriores en el eje de ordenadas a menudo no son satisfactorias. En nuestro ejemplo, se requiere una escala vertical adicional para una mayor visualización.
Una interfaz de usuario de este tipo difícilmente puede considerarse óptima para las tareas consideradas.
Se crea una experiencia de usuario significativamente más eficaz mediante la implementación del principio WYSIWYGen el trabajo con el área de construcción. La siguiente animación muestra la interacción del usuario con dicha interfaz.
Un ejemplo está escrito en la aplicación Advanced Grapher , pero muchos otros sistemas admiten una opción similar, por ejemplo, la biblioteca MetricsGraphics.js .
La ganancia de velocidad en comparación con MS Excel es obvia aquí. Toda la tarea de escalado se resuelve con un clic:
- se presiona el botón izquierdo del mouse en el punto correspondiente a la esquina de la nueva área rectangular;
- el cursor se mueve a la esquina opuesta de la nueva área;
- se suelta el botón izquierdo del ratón.
Pero esta opción no está exenta de inconvenientes. El primero es la carga adicional que recae sobre el usuario. En una acción combinada, se le pide que ingrese los valores de cuatro parámetros (coordenadas de los límites del área rectangular tmin , tmax , Pmin , Pmax ), lo que requiere su evaluación preliminar "en la mente". Con experiencia, la tarea tiene una dificultad aceptable. Sin embargo, dado que el usuario está principalmente interesado en el intervalo de tiempo, tmin y tmax , tiene sentido calcular la transferencia de la escala vertical a la máquina.
La segunda desventaja también está relacionada con la escala vertical. Consiste en la imposibilidad de implementar esta interfaz para las tareas de la clase considerada. El problema es que con un solo clic en nuestro caso, el usuario ingresa no 4, sino 6, 8 o más valores, dependiendo del número de escalas en la ordenada. Cada escala de la ordenada en el gráfico recibe nuevos valores para los límites superior e inferior, pero de hecho todos estos límites, sin importar cuántos de ellos, están determinados por dos números. Estos números son las ordenadas de la posición del cursor del mouse al principio y al final del clic. La tarea del usuario no solo es más complicada en comparación con el caso de una serie unidimensional. También deja de tener solución: no siempre existe el intervalo general que proporciona una escala aceptable para cada fila.
Por ejemplo, la figura muestra uno de los resultados prácticos de tal escala.
Ambas líneas representan oscilaciones armónicas, tres períodos cada uno en el intervalo de tiempo considerado. Esto se puede determinar visualmente solo después de un ajuste individual adicional de las escalas, ya que las amplitudes de vibración son insignificantes en comparación con los intervalos de ambas escalas. Una mayor reducción de los intervalos mostrados por el método considerado conducirá al desplazamiento de una de las curvas fuera del área de trazado.
Mejora de la interfaz de usuario
Como se señaló anteriormente, la tarea de escalado vertical debe asignarse a una computadora. Para hacer esto, considere cómo lo resuelve el usuario usando el ejemplo de una serie unidimensional.
Como regla general, habiendo decidido el intervalo de tiempo, el usuario determina los extremos locales para representar mejor el rango de valores. La solución óptima para la mayoría de los casos es combinar el rango de valores y el intervalo de escala mostrado (también son posibles algoritmos con una lógica más sutil, cuando el área mostrada tiene un pequeño desplazamiento por encima y por debajo del rango de valores; las diferencias entre estos algoritmos no son fundamentales).
La lógica anterior tiene una implementación bastante simple. El esquema de interfaz para una serie de tiempo unidimensional se muestra en la figura.
La coordenada vertical del clic no importa aquí: la acción de control combinada del usuario define solo los límites izquierdo y derecho de la nueva área de visualización.
El escalado de una serie multidimensional con una nueva interfaz de usuario se muestra en la siguiente animación.
Los datos originales y el nuevo intervalo de tiempo en este ejemplo corresponden al ejemplo del comienzo del artículo. El problema se resolvió mediante la acción más simple con la máxima calidad. La disminución del tiempo requerido y el esfuerzo intelectual del usuario parece evidente.
Limitación de aplicabilidad
También es posible otro enfoque para el escalado vertical: en algunos problemas prácticos, la visualización se justifica en un rango predeterminado de valores, que no depende de los extremos locales. En este caso, es suficiente no cambiar la configuración de la escala vertical, ya que está implementado en MS Excel .