Análisis exploratorio de datos (eda)
Antes de aplicar técnicas estadísticas para un conjunto de datos, es importante examinar los datos para entender sus propiedades básicas. Puede utilizar una serie de técnicas que se conocen colectivamente como Análisis Exploratorio de Datos
(EDA) para analizar un conjunto de datos. EDA ayuda a asegurarse de que usted elija las técnicas estadísticas correctas para analizar y pronosticar los datos. Los dos tipos básicos de técnicas de EDA son gráfico técnicas y cuantitativo técnicas.Técnicas de gráfica EDA
Técnicas de gráfica EDA muestran las propiedades clave de un conjunto de datos en un formato conveniente. A menudo es más fácil de entender las propiedades de una variable y las relaciones entre las variables examinado gráficos en lugar de mirar los datos en bruto. Es posible utilizar varias técnicas gráficas, en función del tipo de datos que se analizaron. Utilice el siguiente:
Los diagramas de caja
Histogramas
Gráficos de probabilidad normal
Diagramas de dispersión
Técnicas cuantitativas EDA
Técnicas cuantitativas EDA proporcionan un método más riguroso de la determinación de las propiedades clave de un conjunto de datos. Dos de las más importantes de estas técnicas son
La estimación del intervalo.
La prueba de hipótesis.
Intervalo las estimaciones se utilizan para crear una alcance de los valores dentro de la cual es probable que caiga una variable. Hipótesis prueba se utiliza para probar diversas proposiciones sobre un conjunto de datos, tales como
El valor medio del conjunto de datos.
La desviación estándar del conjunto de datos.
La distribución de probabilidad del conjunto de datos sigue.
La prueba de hipótesis es una técnica fundamental en las estadísticas.