Suavizado exponencial
Teoría del suavizado exponencial
Me gustaría escribir un artículo sobre indicadores técnicos y hablarles de la media móvil exponencial. Sin embargo, resultó que al estudiar la teoría de este indicador, me encontré con algunas cosas interesantes más relacionadas con la estadística que con la bolsa o el mercado de divisas.
Como la estadística ya ha sido mencionada en este sitio, he decidido escribir un artículo separado sobre ella - el artículo sobre el suavizado exponencial en el análisis de series temporales.
Este tema fue planteado en el artículo Fluctuaciones estacionales. Índices estacionales. Método de las medias simples. El cálculo de los índices de estacionalidad media de los métodos de la media podría aplicarse principalmente a las series temporales en las que no hubiera tendencias ascendentes/descendentes, o fueran insignificantes. En otras palabras, el valor observado fluctúa en torno a algún valor permanente._
¿Qué significa esto? Significa que la media es constante, y por eso no puede captar la tendencia.
Ilustrémoslo con un gráfico.
En general, todos los métodos de promedio pretenden eliminar el "ruido" de la dispersión aleatoria de los datos que permite identificar la tendencia con mayor claridad o los cambios estacionales o cíclicos, es decir, la estructura interna de los datos, aparentemente aleatoria, y utilizarla para construir el modelo, seguido del análisis y la previsión de los valores futuros, pero como vemos, el simple método de promedio no funciona si hay una tendencia pronunciada. No podemos predecir nada con su ayuda.
Debemos ser capaces de recibir no solo una media, sino una serie media. Y el método más popular (y sencillo) para obtener esas series es el suavizado exponencial.
Se puede describir de la siguiente manera - Cuando se hace una previsión, los valores más nuevos de los valores observados tienen un mayor peso en comparación con los valores más antiguos. Al mismo tiempo, a los valores más antiguos se les da un peso exponencialmente decreciente.
Ahora describimos la definición con fórmulas.
Tradicionalmente se denota el valor observado como , y la media suavizada como .
Entonces,
indefinido
y, generalizado
donde, toma el valor del rango [0;1)
De ahí viene el expositor - revelador de la media anterior.
y, generalizado
, para t > 2
Así, el peso antes de - es una progresión geométrica infinitamente decreciente con multiplicador
Y cuanto más lejos esté S, menos le afectan los valores iniciales.
Supongamos que y veamos cómo cambia su contribución para los distintos S.
Para S2, se toma tal cual, pero en S3 con un coeficiente alfa de 0,5, la contribución de y1 es solo de 250, en S4 - 125, y así sucesivamente.
Simultáneamente, la elección del coeficiente es importante. Si se juega con el parámetro "a" en la calculadora (ver arriba), está claro que cuanto más alto es el valor, más rápido deja de afectar la cuenta atrás a la media suavizada, y viceversa - cuanto más bajo, más tiempo conserva su influencia.
En consecuencia, para pequeño, el método de obtención de S2 tiene una gran influencia en el resultado. La asignación es solo uno de los métodos. Como alternativa, el valor inicial puede ser una simple media de los primeros valores de y, por ejemplo.
Pero, ¿cómo se elige ? ¿Qué índice es el más adecuado para la simulación de la dinámica de esta serie? No existen fórmulas matemáticas para el cálculo exacto de . La mayoría de las veces este indicador se elige por selección o por el método de "pruebas y errores".
El método consiste en que se toman múltiples valores de y luego, entre ellos, se selecciona el mejor. ¿Cuál es el criterio de "mejor" en nuestro caso?
Ese criterio es minimizar la media de los errores al cuadrado. El error - es la desviación del valor real de la previsión. Para cada valor S, se eleva al cuadrado para eliminar la influencia del signo y luego se calcula la media de todos los valores. Ese índice, para el que el valor medio y el mínimo son los mejores de varios.
Ahora unas palabras sobre la predicción.
El siguiente valor de la serie se predice directamente a partir de la fórmula
Si es necesario obtener una previsión para un mayor número de muestras, se utiliza la técnica denominada bootstrapping. El último valor conocido de "y" se toma como una constante y se utiliza en la fórmula recursiva.
Ahora aplique este conocimiento al calcular la media suavizada para el gráfico mostrado al principio de este artículo. Para hacer esto más interesante, calculamos la media suavizada para los tres valores a la vez , y al mismo tiempo calculamos el error cuadrático medio.
El gráfico muestra como referencia el siguiente valor predicho, es decir, la media móvil extendida para un recuento más allá de los datos reales.
Por cierto, debo señalar que el mejor valor por defecto de la calculadora por encima de será 0.7.
Con igual a 1, el suavizado degenera en una repetición de valores penúltimos que bajo una variación significativa, los valores vecinos no siempre dan un error cuadrático medio mínimo.
Comentarios