Fórmulas estadísticas importantes para grandes datos

La palabra estadística

puede evocar miedo en algunos principiantes a la visualización de datos, pero si usted no hace caso de este tema, usted pasa por alto una de las maneras más eficaces para derivar verdadera visión y el valor de Big Data.

Estadísticas es la práctica o la ciencia de la recogida de datos numéricos en grandes cantidades. Usted no tiene que salir y convertirse en un científico de datos (un término usado para los estadísticos que también son frikis de datos en el encubrimiento y que por lo general tienen algún tipo de grado avanzado, como un doctorado), pero es posible que desee considerar la posibilidad de recoger un 101 libro o una clase de Estadística si tienen algún interés.

Fórmulas estadísticas tales como la probabilidad, la varianza, y las previsiones son muy populares hoy en día. Son bastante fáciles de aplicar a cualquier conjunto de datos, y la mayoría de los lectores entenderán claramente. Puede incorporar algunas de estas fórmulas estadísticas en sus visualizaciones de datos grandes para proporcionar valor real a los usuarios mediante el uso de las técnicas descritas en los apartados siguientes.

Conocer la probabilidad de que un evento ocurra

Una fórmula estadística que usted puede estar familiarizado con es probabilidad - la probabilidad o posibilidad de que se puede producir un evento. La siguiente fórmula calcula probabilidad básica para un escenario lineal. (Escenarios no lineales son un poco complejo y demasiado de una empresa para un novato.)

Probabilidad = Probabilidad un evento ocurra / número de resultados posibles

La siguiente figura muestra una probabilidad con algunos colores de alerta añadido para que el mensaje de fácil lectura y, más importante, para indicar claramente que es necesaria una acción inmediata.

imagen0.jpg

Probabilidades proporcionan una revisión de la realidad rápido y establecen el tono general de la historia de la visualización de datos proporcionará durante un período determinado (día, semana, trimestre, etc.).

La aplicación de la varianza para mostrar la magnitud del cambio

Otra medida estadística popular es vAriance, que es la diferencia entre un conjunto de puntos de datos.

La fórmula más utilizada para el cálculo de la varianza es

Varianza = final deseado - Estado actual

Si la salida se muestra es un número entero o porcentaje, la fórmula muestra la magnitud del cambio entre el comienzo y el estado final de un punto de datos.

Viendo la varianza es siempre una victoria rápida y un gran sustituto para el gráfico combinado de / bar, que es cómo se muestra la relación de la varianza en la mayoría de visualizaciones.

El gráfico en la figura siguiente muestra un gráfico combinado de / bar que permite al usuario descifrar la varianza para cada mes.

image1.jpg

El segundo gráfico, se muestra en la siguiente figura, traza claramente la varianza y toma todas las conjeturas de lo visual.

image2.jpg

Pronosticar el futuro

Sin embargo, otra fórmula estadística popular que usted puede estar familiarizado con es el Forecast, que es el acto de predecir o estimar un evento o tendencia.

Al calcular un pronóstico, en realidad está utilizando una cierta cantidad de datos históricos para predecir el comportamiento, un evento específico, o una tendencia. Por ejemplo, se podría calcular las ventas para el año basado en el hecho histórico de que enero suele representa el 5% de las ventas. Si usted recibe $ 500 en ventas en enero, entonces sería utilizar la siguiente fórmula para predecir la cantidad de ventas que usted puede anticipar para el año:

$ 500 / 0,05 = $ 10,000

En esta ecuación, $ 500 es las ventas en enero a 0,05 es el porcentaje histórico de ventas que representa enero lucro y $ 10,000 es que las ventas proyectadas para el año.

La siguiente figura muestra cómo se muestran las previsiones en la mayoría de visualizaciones de datos como una simple línea en un gráfico. Las previsiones indican cómo una determinada actividad puede llevar a cabo en el futuro.

Esta pantalla típica de una línea de previsión muestra que el flujo de caja con el tiempo se convertirá en un problema para ª
Esta pantalla típica de una línea de previsión muestra que el flujo de caja con el tiempo se convertirá en un problema para esta organización.



» » » » Fórmulas estadísticas importantes para grandes datos