Análisis exploratorio de datos cuantitativos (eda) técnicas

Aunque EDA se basa principalmente en las técnicas gráficas, también consiste en unas pocas técnicas cuantitativas. Este artículo aborda dos de ellos: la estimación del intervalo y prueba de hipótesis.

La estimación del intervalo

La estimación del intervalo es una técnica que se utiliza para construir una alcance de los valores dentro de la cual es probable que caiga una variable. Un ejemplo importante de esto es el intervalo de confianza. LA intervalo de confianza es una gama de números que es probable que contenga el valor de una medida de población, tales como la media. Un intervalo de confianza se construye como sigue:

imagen0.jpg

El intervalo de confianza consiste en una límite inferior igual a la estimación puntual menos el margen de error, y una limite superior igual a la estimación puntual más el margen de error.

los estimación puntual es un solo valor estimado de una muestra. Por ejemplo, la media de la muestra es una estimación puntual de la media poblacional. Del mismo modo, la desviación estándar de la muestra es una estimación puntual de la desviación estándar de la población.

El margen de error refleja la cantidad de incertidumbre asociada a la estimación puntual. En otras palabras, se muestra la cantidad de la estimación puntual puede cambiar de una muestra a la siguiente. El margen de error se basa en la desviación estándar y el tamaño de la muestra que está siendo utilizado. El resultado de estos cálculos es una gama de valores que es probable que contenga el verdadero valor de la medida de población.

Por ejemplo, supongamos que un investigador determina que el 95 por ciento de confianza, el intervalo (-2,0 por ciento, 8,0 por ciento) contiene el verdadero valor de la media vuelta a la SP 500 el próximo año. La media de la muestra es la media del límite inferior y superior de este intervalo (es decir, 3,0 por ciento). El margen de error es, por tanto, 5 por ciento.

La prueba de hipótesis

LA hipótesis estadísticas es una declaración que se supone que es cierto a menos que haya una fuerte evidencia contradictoria. La prueba de hipótesis es ampliamente utilizado en muchas disciplinas para determinar si una proposición es verdadera o falsa. Por ejemplo, la prueba de hipótesis podría ser utilizado para determinar si

  • La edad media de los residentes de un estado es de 43 años de edad.

  • La rentabilidad media de los stocks en una cartera es de 7,2 por ciento.

  • La cantidad de precipitación anual en una ciudad sigue la distribución normal.

La prueba de hipótesis es un proceso de múltiples pasos que consiste en lo siguiente:

  1. La declaración de la hipótesis nula: Esta es la declaración de que se supone que es cierto.

  2. La declaración de la hipótesis alternativa: Esta es la declaración que será aceptada si la hipótesis nula es rechazada.

  3. El nivel de significación en la que se llevará a cabo la prueba de hipótesis: Esto es igual a la probabilidad de rechazar la hipótesis nula cuando es falsa.

  4. La estadística de prueba: Esta es una medida numérica que muestra si los datos de la muestra es consistente con la hipótesis nula.

  5. El valor crítico: si la estadística de prueba es más extremo que el valor crítico, la hipótesis nula es rechazada.

  6. La decisión: En base a la relación entre la estadística de prueba y el valor crítico, que tomar una decisión en cuanto a si o no la hipótesis nula debe ser rechazada.




» » » » Análisis exploratorio de datos cuantitativos (eda) técnicas