Gráficos de dispersión: técnica gráfica de datos estadísticos
A diferencia de un diagrama de tallo y hojas, un gráfico de dispersión está destinado a mostrar la relación entre de dos variables. Puede ser difícil de ver si hay una relación entre dos variables con sólo mirar los datos en bruto, pero con un gráfico de dispersión, los patrones que existen en los datos a ser mucho más fácil de ver.
Un gráfico de dispersión consiste en una serie de puntos- cada punto muestra un solo valor para dos variables diferentes. Por ejemplo, usted podría construir un diagrama de dispersión para mostrar la relación entre los ingresos anuales de una empresa y sus beneficios anuales. Si usted está tratando de predecir las ganancias en base a los ingresos, el eje X se utiliza para mostrar los ingresos anuales, y el eje Y se utiliza para mostrar los beneficios anuales. Así, los ingresos son considerados como la variable independiente, y las ganancias se consideran como la variable dependiente en esta relación.
En un gráfico de dispersión, el eje X (es decir, el eje horizontal) se utiliza para mostrar la independiente variables, y el eje Y (el eje vertical) se utiliza para mostrar la dependiente variable.
En este ejemplo, cada punto de la gráfica de dispersión muestra los ingresos y las ventas para un año específico. La tabla muestra la relación entre los ingresos anuales y las ganancias anuales de una empresa durante los años 2004-2014.
Año | Ingresos (en millones de dólares) | Ganancias ($ millones) |
---|---|---|
2004 | 225 | 42 |
2005 | 237 | 43 |
2006 | 245 | 48 |
2007 | 222 | 40 |
2008 | 265 | 60 |
2009 | 270 | 56 |
2010 | 254 | 53 |
2011 | 280 | 60 |
2012 | 290 | 62 |
2013 | 305 | sesenta y cinco |
2014 | 312 | 71 |
La siguiente figura muestra el diagrama de dispersión resultante.
Cada punto de la gráfica de dispersión representa los ingresos y beneficios relacionados de la empresa para un solo año. Por ejemplo, el punto en la parte superior derecha, esquina de la trama representa datos para el año 2014, cuando los ingresos de la corporación fueron $ 312 millones y las ganancias fueron de $ 71 millones.
Puede utilizar un gráfico de dispersión para determinar si
Las dos variables tienden a moverse en la misma dirección.
Las dos variables tienden a moverse en direcciones opuestas.
Las dos variables no están relacionadas entre sí.
Si dos variables tienden a moverse en la misma dirección, que se dice que son positivamente correlated- si tienden a moverse en direcciones opuestas, que se dice que son negativamente correlacionados. Si dos variables no muestran ningún patrón particular, que se dice que son correlacionadas.
Esta figura muestra un gráfico de dispersión de dos variables (X e Y) que se correlacionan positivamente.
El gráfico de dispersión muestra que a medida que X aumenta, hay una fuerte tendencia para Y para aumentar (pero no necesariamente en la misma cantidad). Esto demuestra que X e Y están correlacionadas positivamente.
La siguiente figura muestra el mismo gráfico de dispersión con un tendencia de línea la ecuación de esta línea se estima con análisis de regresión.
La línea de tendencia muestra cómo muchos cambios Y en promedio, debido a un cambio específico en X. Una línea de tendencia con pendiente positiva indica que dos variables están positivamente correlated- del mismo modo, una línea de tendencia con pendiente negativa indica que dos variables están correlacionadas negativamente. Si una línea de tendencia es plana (es decir, tiene una pendiente cero), esto indica que las dos variables no están relacionadas entre sí. La línea de tendencia con pendiente positiva muestra que X e Y se correlacionan positivamente.
La siguiente figura muestra un diagrama de dispersión y la línea de tendencia de las dos variables que son negativamente correlacionados.
El gráfico de dispersión muestra que a medida que X aumenta, Y tiende a decrease- la línea de tendencia tiene una negativo cuesta abajo. Por lo tanto, X e Y son negativamente correlacionados.
La siguiente figura muestra un diagrama de dispersión y la línea de tendencia de las dos variables que son correlacionadas.
El gráfico de dispersión muestra que a medida que X aumenta, Y a veces aumenta ya veces disminuye. No hay un patrón en particular a los datos. Los puntos parecen estar dispersos al azar en todo el diagrama. Como resultado, la línea de tendencia es casi plana, y esto muestra que X e Y son correlacionadas.
Para un ejemplo del mundo real, esta cifra muestra un gráfico de dispersión de la relación entre el precio de las acciones de Apple y la Norma y 500 de la índice del mercado de pobres de 1 1ro, 2013 hasta 12 31, 2013.
500 (SP 500) El índice Standard & Poor 's es un promedio de los precios de las 500 mayores acciones de Estados Unidos. El valor de este índice refleja el estado general de la economía estadounidense. El gráfico muestra que hay una correlación positiva entre el precio de las acciones de Apple y el SP 500.