Son los elementos del conjunto de datos sin correlación?
Para un conjunto de datos que consiste en observaciones tomadas en diferentes puntos en el tiempo (es decir, datos de series de tiempo), Es importante para determinar si o no las observaciones están correlacionadas entre sí. Esto es porque muchas técnicas para el modelado de datos de series de tiempo se basan en la suposición de que los datos no está correlacionado entre sí (independiente).
Una técnica gráfica que puede utilizar para ver si los datos no está correlacionado con los demás es la función de autocorrelación. La función de autocorrelación muestra la correlación entre las observaciones en una serie de tiempo con diferentes rezagos. Por ejemplo, la correlación entre las observaciones con retardo 1 se refiere a la correlación entre cada observación individual y su valor anterior.
Esta figura muestra la función de autocorrelación de los retornos diarios de ExxonMobil en 2013.
Cada "pico" en la función de autocorrelación representa la correlación entre las observaciones con un desfase dado.
La autocorrelación con un desfase 0 siempre es igual a 1, ya que este representa las correlaciones de las observaciones con ellos mismos.
En el gráfico, las líneas discontinuas representan los límites inferior y superior de una intervalo de confianza. Si un pico se eleva por encima del límite superior del intervalo de confianza o cae por debajo del límite inferior del intervalo de confianza, que muestra que la correlación para ese retraso no es 0. Esto es evidencia en contra de la independencia de los elementos de un conjunto de datos.
En este caso, sólo hay un pico estadísticamente significativa (al lag 8). Este pico muestra que los rendimientos de ExxonMobil pueden ser independientes. Una prueba estadística más formal podría mostrar si eso es cierto o no.