Cómo calcular una correlación

Can una medida estadística tanto la fuerza y ​​la dirección de una relación lineal entre dos variables? ¡Por supuesto! Los estadísticos utilizan el coeficiente de correlación para medir la fuerza y ​​la dirección de la relación lineal entre dos variables numéricas X y Y. El coeficiente de correlación para una muestra de datos se denota por r.

Aunque la definición de la calle correlación se aplica a cualquiera de los dos elementos que están relacionados (como el género y la afiliación política), los estadísticos utilizan este término sólo en el contexto de dos variables numéricas. El término formal para la correlación es la coeficiente de correlación. Muchos diferentes medidas de correlación se han creado- la utilizada en este caso se denomina Coeficiente de correlación de Pearson.

La fórmula para la correlación (r) es

image0.jpg

dónde n es el número de pares de datos;

image1.jpg

son las medias de las muestras de todos los X-valores y todo el y-valores, respectivamente- y sX y sy son las desviaciones estándar de muestra de todo el X- y y-valores, respectivamente.

Puede utilizar los siguientes pasos para calcular la correlación, r, de un conjunto de datos:

  1. Encuentra la media de todo el X-valores

    image2.jpg
  2. Encuentra la desviación estándar de todos los X-valores (llamarlo sX) Y la desviación estándar de todos los y-valores (llamarlo sy).

    Por ejemplo, para encontrar sX, usted utilizaría la siguiente ecuación:

    image3.jpg
  3. Para cada una de las n pares (X, y) En el conjunto de datos, tomar

    image4.jpg
  4. Sume el n resultados de la Etapa 3.

  5. Divida la suma por sX # 8727- sy.

  6. Divida el resultado por n - 1, donde n es el número de (X, y) Pares. (Es lo mismo que multiplicar por 1 sobre n - 1.)

    Esto le da la correlación, r.

Por ejemplo, suponga que tiene el conjunto de datos (3, 2), (3, 3), y (6, 4). Se calcula el coeficiente de correlación r a través de los siguientes pasos. (Tenga en cuenta que para estos datos el X-valores son 3, 3, 6, y el y-valores son 2, 3, 4.)

  1. El cálculo de la media de los valores x e y, se obtiene

    image5.jpg
  2. Las desviaciones estándar son sX = 1,73 y sy = 1.00.

  3. los n = 3 diferencias encontradas en el Paso 2 multiplican entre sí son: (3 - 4) (2 - 3) = (- 1) (- 1) = + 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6 - 4) (4 - 3) = (2) (1) = 2.

  4. Agregar el n = 3 Paso 3 resultados, se obtiene 1 + 0 + 2 = 3.

  5. Dividiendo por sX # 8727- sy le da 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (Es sólo una coincidencia que el resultado del paso 5 es también 1,73.)

  6. Ahora dividir el Paso 5 resultado por 3 - 1 (que es 2), y se obtiene la correlación r = 0.87.




» » » » Cómo calcular una correlación