Gráficos de dispersión: técnica gráfica de datos estadísticos

A diferencia de un diagrama de tallo y hojas, un gráfico de dispersión está destinado a mostrar la relación entre de dos variables. Puede ser difícil de ver si hay una relación entre dos variables con sólo mirar los datos en bruto, pero con un gráfico de dispersión, los patrones que existen en los datos a ser mucho más fácil de ver.

Un gráfico de dispersión consiste en una serie de puntos- cada punto muestra un solo valor para dos variables diferentes. Por ejemplo, usted podría construir un diagrama de dispersión para mostrar la relación entre los ingresos anuales de una empresa y sus beneficios anuales. Si usted está tratando de predecir las ganancias en base a los ingresos, el eje X se utiliza para mostrar los ingresos anuales, y el eje Y se utiliza para mostrar los beneficios anuales. Así, los ingresos son considerados como la variable independiente, y las ganancias se consideran como la variable dependiente en esta relación.

En un gráfico de dispersión, el eje X (es decir, el eje horizontal) se utiliza para mostrar la independiente variables, y el eje Y (el eje vertical) se utiliza para mostrar la dependiente variable.

En este ejemplo, cada punto de la gráfica de dispersión muestra los ingresos y las ventas para un año específico. La tabla muestra la relación entre los ingresos anuales y las ganancias anuales de una empresa durante los años 2004-2014.

Los ingresos anuales y beneficios 2004-2014
AñoIngresos (en millones de dólares)Ganancias ($ millones)
200422542
200523743
200624548
200722240
200826560
200927056
201025453
201128060
201229062
2013305sesenta y cinco
201431271

La siguiente figura muestra el diagrama de dispersión resultante.

Gráfico de dispersión de los ingresos anuales y beneficios 2004-2014.
Gráfico de dispersión de los ingresos anuales y beneficios 2004-2014.

Cada punto de la gráfica de dispersión representa los ingresos y beneficios relacionados de la empresa para un solo año. Por ejemplo, el punto en la parte superior derecha, esquina de la trama representa datos para el año 2014, cuando los ingresos de la corporación fueron $ 312 millones y las ganancias fueron de $ 71 millones.

Puede utilizar un gráfico de dispersión para determinar si

  • Las dos variables tienden a moverse en la misma dirección.

  • Las dos variables tienden a moverse en direcciones opuestas.

  • Las dos variables no están relacionadas entre sí.

Si dos variables tienden a moverse en la misma dirección, que se dice que son positivamente correlated- si tienden a moverse en direcciones opuestas, que se dice que son negativamente correlacionados. Si dos variables no muestran ningún patrón particular, que se dice que son correlacionadas.

Esta figura muestra un gráfico de dispersión de dos variables (X e Y) que se correlacionan positivamente.

Gráfico de dispersión de dos variables correlacionadas positivamente.
Gráfico de dispersión de dos variables correlacionadas positivamente.

El gráfico de dispersión muestra que a medida que X aumenta, hay una fuerte tendencia para Y para aumentar (pero no necesariamente en la misma cantidad). Esto demuestra que X e Y están correlacionadas positivamente.

La siguiente figura muestra el mismo gráfico de dispersión con un tendencia de línea la ecuación de esta línea se estima con análisis de regresión.

Gráfico de dispersión de dos variables correlacionadas positivamente con una línea de tendencia.
Gráfico de dispersión de dos variables correlacionadas positivamente con una línea de tendencia.

La línea de tendencia muestra cómo muchos cambios Y en promedio, debido a un cambio específico en X. Una línea de tendencia con pendiente positiva indica que dos variables están positivamente correlated- del mismo modo, una línea de tendencia con pendiente negativa indica que dos variables están correlacionadas negativamente. Si una línea de tendencia es plana (es decir, tiene una pendiente cero), esto indica que las dos variables no están relacionadas entre sí. La línea de tendencia con pendiente positiva muestra que X e Y se correlacionan positivamente.

La siguiente figura muestra un diagrama de dispersión y la línea de tendencia de las dos variables que son negativamente correlacionados.

Gráfico de dispersión de dos variables correlacionadas negativamente con una línea de tendencia.
Gráfico de dispersión de dos variables correlacionadas negativamente con una línea de tendencia.

El gráfico de dispersión muestra que a medida que X aumenta, Y tiende a decrease- la línea de tendencia tiene una negativo cuesta abajo. Por lo tanto, X e Y son negativamente correlacionados.

La siguiente figura muestra un diagrama de dispersión y la línea de tendencia de las dos variables que son correlacionadas.

Gráfico de dispersión de dos variables no correlacionadas con una línea de tendencia.
Gráfico de dispersión de dos variables no correlacionadas con una línea de tendencia.

El gráfico de dispersión muestra que a medida que X aumenta, Y a veces aumenta ya veces disminuye. No hay un patrón en particular a los datos. Los puntos parecen estar dispersos al azar en todo el diagrama. Como resultado, la línea de tendencia es casi plana, y esto muestra que X e Y son correlacionadas.

Para un ejemplo del mundo real, esta cifra muestra un gráfico de dispersión de la relación entre el precio de las acciones de Apple y la Norma y 500 de la índice del mercado de pobres de 1 1ro, 2013 hasta 12 31, 2013.

Gráfico de dispersión de los precios diarios de las acciones de Apple y el S & P 500.
Gráfico de dispersión de los precios diarios de las acciones de Apple y el SP 500.

500 (SP 500) El índice Standard & Poor 's es un promedio de los precios de las 500 mayores acciones de Estados Unidos. El valor de este índice refleja el estado general de la economía estadounidense. El gráfico muestra que hay una correlación positiva entre el precio de las acciones de Apple y el SP 500.




» » » » Gráficos de dispersión: técnica gráfica de datos estadísticos