Distribuciones de probabilidad en el análisis estadístico de datos grande
Distribuciones de probabilidad es una de las muchas técnicas estadísticas que pueden ser usados para analizar los datos para encontrar patrones útiles. Se utiliza un Distribución de probabilidad para calcular las probabilidades asociadas con los elementos de un conjunto de datos:
Distribución binomial: Se podría utilizar la distribución binomial para analizar las variables que pueden asumir solamente uno de los dos valores. Por ejemplo, puede determinar la probabilidad de que un determinado porcentaje de los miembros en un club deportivo se quedan; mano.
Distribución de Poisson: Se podría utilizar la distribución de Poisson para describir la probabilidad de que un determinado número de eventos que ocurren durante un intervalo de tiempo. Por ejemplo, podría ser usado para describir la probabilidad de un número especificado de los accesos a un sitio web durante la próxima hora.
Distribución normal: La distribución normal es la distribución más utilizado probabilidad en la mayoría de las disciplinas, incluyendo la economía, las finanzas, el marketing, la biología, la psicología, y muchos otros. Uno de los rasgos característicos de la distribución normal es simetría - la probabilidad de una variable siendo una distancia dada por debajo de la media de la distribución es igual a la probabilidad de que sea la misma distancia por encima de la media.
Por ejemplo, si la altura media de todos los hombres en los Estados Unidos es de 70 pulgadas, y alturas se distribuyen normalmente, un hombre elegido al azar es igualmente probable que sea entre 68 y 70 pulgadas de alto como él es estar entre 70 y 72 pulgadas de alto .
La distribución normal funciona bien con muchas aplicaciones. Por ejemplo, se utiliza a menudo en el campo de las finanzas para describir los rendimientos de los activos financieros. Debido a su facilidad de interpretación y aplicación, la distribución normal se utiliza a veces incluso cuando el supuesto de normalidad es sólo aproximadamente correcta.
Distribución t de Student: Distribución t de Student es similar a la distribución normal, pero con la distribución t de Student, valores extremadamente pequeños o extremadamente grandes son mucho más probable que ocurra. Esta distribución se utiliza a menudo en situaciones en las que una variable exhibe demasiada variación para ser coherente con la distribución normal. Esto es cierto cuando se están analizando las propiedades de muestras pequeñas. Con muestras pequeñas, la variación entre muestras es probable que sea bastante considerable, por lo que la distribución normal no debe ser usado para describir sus propiedades.
Distribución t de Student fue desarrollado por WS Gosset mientras trabajaba en la empresa cervecera Guinness. Él estaba tratando de describir las propiedades de los pequeños medios de muestra.
La distribución de chi-cuadrado: La distribución de chi-cuadrado es apropiado para varios tipos de aplicaciones. Por ejemplo, se puede utilizar para determinar si una población sigue una distribución de probabilidad particular. También puede utilizarlo para comprobar si la varianza de una población es igual a un valor especificado, y para la prueba de la independencia de los dos conjuntos de datos.
El F-distribución: La distribución F se deriva de la distribución chi-cuadrado. Se utiliza para probar si las varianzas de dos poblaciones son iguales entre sí. La distribución F también es útil en aplicaciones tales como análisis de regresión.
Sobre el autor
Distribuciones de probabilidad discretas y continuas Los dos tipos básicos de las distribuciones de probabilidad se conocen como discreta y continua. Discreta distribuciones describen las propiedades de una variable al azar para los que se asigna cada resultado individual una probabilidad…
Cómo una distribución normal afecta a la forma de una distribución de muestreo En las estadísticas, cuando la distribución original para una población X es normal, entonces usted también puede asumir que la forma de la distribución de muestreo, oTambién será normal, independientemente del tamaño de muestra n.Por…
¿Cómo se ve afectada una distribución de muestreo cuando la distribución no es normal En estadística, si una población X tiene cualquier distribución que es no lo normal, o si su distribución es desconocida, no se puede decir de forma automática la distribución de las medias de la muestratiene una distribución normal. Pero…
Cómo el número de grados de libertad afecta a la gráfica de una distribución t Una de las propiedades interesantes de la distribución t es que cuanto mayor es el grado de libertad, más de cerca la distribución t se asemeja a la distribución normal estándar. A medida que los grados de libertad aumenta, el área en las…
Cómo calcular el valor esperado, la varianza y la desviación estándar de una distribución t Distribuciones de probabilidad, incluyendo la distribución t, tienen varios momentos, incluyendo el valor esperado, la varianza y la desviación estándar (una momento es una medida resumen de una distribución de probabilidad):El primer momento de…
¿Cómo encontrar percentiles de una distribución t Cuando usted quiere encontrar percentiles para un t-distribución, se puede utilizar el t-mesa. LA percentil es un número en una distribución estadística cuya menos que la probabilidad es la porcentaje- dada por ejemplo, el percentil 95 de la…
¿Cómo encontrar los momentos de la distribución binomial Momentos son medidas de resumen de una distribución de probabilidad, e incluyen el valor esperado, la varianza y la desviación estándar. El valor esperado representa el valor medio o promedio de una distribución. El valor esperado se conoce a…
Cómo graficar la distribución binomial Una forma de ilustrar la distribución binomial es con un histograma. Un histograma muestra los valores posibles de una distribución de probabilidad como una serie de barras verticales. La altura de cada barra refleja la probabilidad de cada valor…
¿Cómo decirle a un z-distribución de una distribución t Aunque la normal (Z-) Distribución y t-distribución son similares, se ven diferentes entre sí y se utilizan para diferentes fines estadísticos. La distribución normal es que la distribución en forma de campana conocida cuya media esy cuya…
¿Cómo se utilizan los valores z en las estadísticas Si un conjunto de datos estadísticos tiene una distribución normal, se acostumbra a estandarizar todos los datos para obtener puntuaciones estándar conocido como z-valores o z-puntajes. La distribución de z-valores adquiere una distribución…
Variables aleatorias y distribuciones de probabilidad en las estadísticas empresariales Variables aleatorias y distribuciones de probabilidad son dos de los conceptos más importantes en las estadísticas. LA variable al azar asigna valores numéricos únicos para los resultados de un experimento- azar este es un proceso que genera…
Distribuciones estadísticas: binomial, y t-distribución normal Una distribución estadística es una lista de los posibles valores de una variable (o intervalos de valores) y la frecuencia (o en qué densidad) que se produzcan. Se puede tomar varias formas, incluyendo binomial, normal, y t-distribución.LA…