Histogramas: técnica gráfica de datos estadísticos
LA histograma es un gráfico que representa la distribución de probabilidad de un conjunto de datos. Un histograma tiene una serie de barras verticales, donde cada barra representa un único valor o un rango de valores para una variable. Las alturas de las barras indican las frecuencias o probabilidades de los diferentes valores o rangos de valores.
Por ejemplo, esta cifra muestra un histograma de los precios diarios de las acciones de Apple a partir de 1 enero 2013 hasta 31 diciembre 2013.
De acuerdo con este histograma, la mayoría de los precios eran entre $ 60 y $ 65- el precio era en este rango de 81 veces durante el año. El segundo precios observados con mayor frecuencia fueron entre $ 55 y $ 60 el precio desembarcado en este rango de 44 veces durante el año. El tercer rango más frecuente de los precios fue de entre $ 65 y $ 70, y el cuarto rango más frecuente de los precios fue de entre $ 70 y $ 75. Son muy pocos los precios eran entre $ 50 y $ 55, y los precios que menos observados durante el año fueron entre $ 80 y $ 85.
Basado en la gráfica, la media y la mediana del precio estaban cerca de el rango de $ 60 a $ 65. La media real fue de $ 65.67, y la mediana real fue de $ 63.65. Desde la media supera la mediana, la distribución de los precios para el año 2013 fue positivamente sesgada. Esto indica que la probabilidad de un precio extremadamente grande es algo mayor que la probabilidad de un precio extremadamente bajo.
Una distribución es sesgada positivamente si la media es mayor que el-mediana es negativamente sesgada si la media es menor que la mediana. La distribución es simétrica con respecto a la media si la media es igual a la mediana. ¿Cuánto los datos están sesgados depende de hasta qué punto difieren de la media y la mediana. Si están muy cerca, a veces es práctico para tratar la distribución como simétrica.
Como otro ejemplo, esta cifra muestra un histograma de los precios diarios del SP 500 índice bursátil de en 1, 2013 a dic 31, 2013.
De acuerdo con el histograma de la figura 12-10, el rango de precios durante el año más frecuentemente observado fue de entre $ 1.650 y $ 1.700. La media resultó ser $ 1,643.80, y la mediana fue de $ 1,650.41. A diferencia de las acciones de Apple, la media fue de abajo la-mediana de la distribución de los precios para el año 2013 es negativamente sesgada. Esto indica que hubo una tendencia levemente mayor para el Standard and Poors 500 operando por debajo de la media de por encima de la media en 2013.
Uno de los usos más importantes de histogramas es para determinar si un conjunto de datos sigue una distribución de probabilidad especificada. Aunque hay muchas pruebas estadísticas formales para determinar qué probabilidad de distribución de un conjunto de datos que sigue, es una buena práctica para inspeccionar visualmente los datos con un gráfico antes de participar en todas las pruebas estadísticas formales.
El histograma de los precios de Apple proporciona una fuerte evidencia de que los precios de las acciones de Apple son no normalmente distribuida. La distribución normal es simétrico sobre su media, mientras que los precios de las acciones de Apple son un sesgo positivo. El histograma de precios SP proporciona una fuerte evidencia de que el SP 500 es también poco probable que se distribuye normalmente, ya que su distribución está sesgada negativamente.
Se requerirían pruebas estadísticas formales para demostrar que ni la distribución es normal, pero los gráficos son muy sugestivos. Debido a que muchas pruebas estadísticas se basan en el supuesto de normalidad, es importante para determinar si una distribución es realmente normal, antes de utilizar cualquiera de estas pruebas.