Cómo utilizar los datos de suavizado en el análisis predictivo

Suavizado de datos

en el análisis predictivo es, en esencia, tratando de encontrar el " la señal " en el " el ruido " descartando los puntos de datos que se consideran " # 148 ;. ruidoso La idea es afinar los patrones en los datos y poner de relieve las tendencias de los datos está señalando a.

imagen0.jpg

La implicación detrás de suavizado de datos es que los datos se compone de dos partes: una parte (que consisten en la puntos de datos básicos) Que significa tendencias generales o tendencias reales, y otra parte que se compone principalmente de las desviaciones (ruido) - Algunos puntos fluctuantes que resultan de cierta volatilidad en los datos. Suavizado de datos busca eliminar esa segunda parte.

Cómo bajar el ruido

Suavizado de datos opera en varios supuestos:

  • Eso fluctuación en los datos es más probable para ser ruido.

  • Que la parte ruidosa de los datos es de corta duración.

  • Esa fluctuación de los datos, independientemente de lo variada que sea, no afectará a las tendencias subyacentes representados por los puntos de datos básicos.

El ruido en los datos tiende a ser aleatorios sus fluctuaciones no debe afectar a las tendencias generales extraídas de examinar el resto de los datos. Así que la reducción o eliminación de puntos de datos ruidosos pueden aclarar las tendencias y patrones reales de los datos - en efecto, la mejora de la década de los datos " señal a ruido ".

Siempre que haya identificado el ruido correctamente y luego reducido que, suavizado de datos puede ayudar a predecir señalan los siguientes datos observados simplemente siguiendo las tendencias más importantes que ha detectado en los datos.

Se ocupa de suavizado de datos con la mayoría de los puntos de datos, sus posiciones en un gráfico, y lo que los patrones resultantes predicen acerca de la tendencia general de (digamos) un precio de las acciones, si su dirección general es hacia arriba, abajo, o hacia los lados.

Esta técnica no predecir con exactitud el precio exacto de la siguiente operación para una determinada población - pero predecir una tendencia general puede dar ideas más potentes que saber el precio real o de sus fluctuaciones.

Un pronóstico basado en una tendencia general se deduce de los datos suavizados asume que cualquiera que sea la dirección que los datos han seguido hasta ahora continuará en el futuro de una manera consistente con la tendencia. En el mercado de valores, por ejemplo, el rendimiento pasado no es indicación definitiva de los resultados futuros, pero sin duda puede ser una guía general para el futuro movimiento del precio de las acciones.

Métodos, ventajas y desventajas de suavizado de datos

Suavizado de datos no se debe confundir con ajustar un modelo, que es parte del análisis de datos que consta de dos pasos:

  1. Encontrar un modelo adecuado que representa los datos.

  2. Asegúrese de que el modelo se ajusta a los datos de manera eficaz.

Suavizado de datos se centra en el establecimiento de una dirección fundamental para los puntos de datos central por (1) haciendo caso omiso de todos los puntos de datos ruidoso y (2) la elaboración de una curva suave a través de los puntos de datos que se salta las serpenteantes y hace hincapié en los patrones primarios - tendencias - en los datos, no importa cómo frenar su aparición. Por consiguiente, en una serie de tiempo numérica, suavizado de datos sirve como una forma de filtrado.

Suavizado de datos puede utilizar cualquiera de los métodos siguientes:

  • Caminata aleatoria se basa en la idea de que el siguiente resultado, o el futuro punto de datos, es una desviación aleatoria de la última conocida, o presente, punto de datos.

  • Media móvil es un promedio móvil de los períodos consecutivos, igualmente espaciados. Un ejemplo sería el cálculo de un promedio móvil de 200 días de un precio de las acciones.

  • Suavización exponencial asigna exponencialmente más peso o importancia, de puntos de datos recientes que a los puntos de datos más antiguos.

  • Sencillo: Este método debe ser utilizado cuando los datos de series de tiempo no tiene ninguna tendencia ni estacionalidad.

  • Linear: Este método debe ser utilizado cuando los datos de series de tiempo tiene una línea de tendencia.

  • Temporada: Este método debe ser utilizado cuando los datos de series de tiempo no tiene ninguna tendencia, pero la estacionalidad.

Lo que estas métodos de suavizado todos tienen en común es que se llevan a cabo algún tipo de proceso de promediación en varios puntos de datos. Dicho promedio de puntos de datos adyacentes es la forma esencial para concentrarse en las tendencias o patrones subyacentes.

Las ventajas de suavizado de datos son

  • Es fácil de implementar.

  • Ayuda a identificar tendencias.

  • Ayuda a exponer patrones en los datos.

  • Elimina los puntos de datos que usted ha decidido no son de su interés.

  • Le ayuda a predecir la dirección general de los próximos puntos de datos observados.

  • Genera gráficos suaves agradables.

Pero todo tiene un lado negativo. Las desventajas de suavizado de datos son

  • Puede eliminar los puntos de datos válidos que resultan de eventos extremos.

  • Se puede llevar a predicciones inexactas si los datos de prueba sólo es estacional y no plenamente representativo de la realidad que genera los puntos de datos.

  • Puede cambiar o sesgar los datos, especialmente los picos, lo que resulta en una imagen distorsionada de lo que está pasando.

  • Puede ser vulnerables a la alteración significativa de los valores atípicos en los datos.

  • Puede dar lugar a una desviación importante de los datos originales.

Si suavizado de datos no hace más que dar los datos de un simple lavado de cara, se puede dibujar un error fundamental de las siguientes maneras:

  • Se puede introducir errores a través de distorsiones que tratan los datos suavizados como si fuera idéntica a los datos originales.

  • Se puede sesgar la interpretación al ignorar - y escondite - riesgos implícitos dentro de los datos.

  • Puede conducir a una pérdida de detalle en sus datos - que es una manera de que una curva suavizada puede desviarse mucho de la de los datos originales.

¿Qué tan seriamente suavizado de datos puede afectar a los datos depende de la naturaleza de los datos a la mano, y cuál es la técnica de suavizado se implementó en esos datos. Por ejemplo, si los datos original tiene más picos en el mismo, a continuación, suavizado de datos dará lugar a mayor desplazamiento de esos picos en los gráficos suavizadas - más probable es que una distorsión.

He aquí algunos puntos de precaución a tener en cuenta cuando se aproxima el suavizado de datos:

  • Es una buena idea comparar los gráficos suavizadas para gráficos vírgenes que trazan los datos originales.

  • Los puntos de datos eliminados durante el suavizado de datos pueden no ser ruido podrían ser puntos de datos válidos y reales que son el resultado de eventos raros pero-real.

  • Suavizado de datos puede ser útil en la moderación, pero su uso excesivo puede conducir a una mala interpretación de los datos.

Mediante la aplicación de su juicio profesional y su experiencia el conocimiento del negocio, puede utilizar los datos de suavizado de manera efectiva. Extracción de ruido de sus datos - sin afectar negativamente a la precisión y utilidad de los datos originales - es por lo menos tanto un arte como una ciencia.




» » » » Cómo utilizar los datos de suavizado en el análisis predictivo