Al igual que todos los temas, las estadísticas tienen su propio idioma. El lenguaje es lo que ayuda a que sabes lo que es un problema está pidiendo, ¿qué se necesitan los resultados, y cómo describir y evaluar los resultados de una manera estadísticamente correcta. He aquí un resumen de los tipos de terminología estadística:
LA población es todo el grupo de personas que desea estudiar, y un muestra es un subconjunto de ese grupo.
LA parámetro es un carácter cuantitativo de la población que está interesado en la estimación o prueba (como una media poblacional o proporción).
LA estadística es una característica cuantitativa de una muestra que a menudo ayuda a estimar o verificar el parámetro de la población (como una media de la muestra o proporción).
Estadísticas descriptivas son resultados individuales que se obtiene al analizar un conjunto de datos - por ejemplo, la media de la muestra, la mediana, la desviación estándar, correlación, recta de regresión, margen de error, y la estadística de prueba.
Inferencia estadística se refiere a la utilización de sus datos (y sus estadísticas descriptivas) para sacar conclusiones acerca de la población. Los principales tipos de inferencia incluyen regresión, intervalos de confianza y pruebas de hipótesis.
Rompiendo Fórmulas estadísticas
Fórmulas abundan en problemas estadísticos - simplemente no hay moverse por ellos. Sin embargo, no suele ser un método en la locura si se puede romper las fórmulas en pedazos. Aquí hay algunos consejos útiles:
Fórmulas para la estadística descriptiva básicamente toman los valores del conjunto de datos y aplicar operaciones aritméticas. A menudo, las fórmulas se ven peor que el proceso en sí mismo. La clave: Si usted puede explicar a su amigo cómo calcular una desviación estándar, por ejemplo, la fórmula es más una idea de último momento.
Fórmulas para la línea de regresión tienen una base en álgebra. En lugar de la típica y = mx + b formato de cada uno aprende en la escuela, los estadísticos uso y = la + bx.
La pendiente, b, es el coeficiente de la X variable.
los y-interceptar, la, es donde la línea de regresión cruza la y-eje.
Las fórmulas para encontrar la y b involucrar a cinco estadísticas: la media de la X-los valores, la media de la y-los valores, las desviaciones estándar para la X's, las desviaciones estándar para la y's, y la correlación.
Todas las diversas fórmulas de intervalo de confianza, cuando se formuló en una lista, puede parecer una mezcolanza de notación. Sin embargo, todos ellos tienen la misma estructura: una estadística descriptiva (de la muestra) más o menos un margen de error. El margen de error implica una z *-valor (de la Z-distribución) o t * -valor (de la t-distribución) veces el error estándar. Las piezas que necesita para el error estándar se proporcionan generalmente en el problema, y el z * - o t * -Los valores vienen de tablas.
Las pruebas de hipótesis también tienen una estructura común. Aunque cada uno de ellos implica una serie de pasos para llevar a cabo, todas se reducen a una sola cosa: la estadística de prueba. LA estadística de prueba medidas hasta qué punto los datos es de lo que la población supuestamente se parece. Toma la diferencia entre su estadística de la muestra y el parámetro (reclamadas) población y estandariza para que pueda mirar hacia arriba en una mesa común y tomar una decisión.
Control de salida de los símbolos estadísticos
Símbolos (o notación) que se encuentran en problemas estadísticos se clasifican en tres categorías: los símbolos matemáticos, símbolos que se refieren a una población, y símbolos que se refieren a una muestra. Símbolos matemáticos son bastante fáciles de descifrar con una simple revisión de algebra- involucran elementos tales como signos cuadrados de raíz, las ecuaciones de una línea, y combinaciones de las operaciones matemáticas. Las otras dos categorías son un poco más difícil, y saber la diferencia entre ellos es fundamental.
Apegarse a una estrategia al resolver problemas de Estadística
Solución de problemas de estadística siempre se trata de tener una estrategia. No se puede leer un problema una y otra vez y esperar para llegar a una respuesta - todo lo que se obtiene es la ansiedad! Aunque no todas las estrategias funcionan para todo el mundo, aquí es una estrategia de tres pasos que ha demostrado su valía:
Marque todo lo que el problema te da.
Por ejemplo, si el problema dice "X tiene una distribución normal con una media de 10 y una desviación estándar de 2, "entrar en acción: Círculo del 10 y escribir # 956-, y la vuelta al 2 y escribir # 963-. De esa manera usted no tiene que cazar más tarde para encontrar los números que necesita.
Escribe lo que te pide para encontrar de una manera estadística.
Sugerencia: preguntas normalmente te dicen lo que quieren en la última línea del problema. Por ejemplo, si se le pide que encuentre la probabilidad de que más de 10 personas acuden a la fiesta, escribir "Encontrar P(X > 10). "
Utilice una fórmula, un proceso, o un ejemplo que he visto para conectar lo que se le pide que encuentre con lo que el problema te da.
Por ejemplo, supongamos que te dicen que X tiene una distribución normal con una media de 80 y una desviación estándar de 5, y desea que la probabilidad de que X es inferior a 90. Etiqueta de lo que te dan "X normal con # 956- = 80 y # 963- = 5. "A continuación, escribir lo que usted necesita para encontrar, usar símbolos:" Averigüe P(X lt; 90). "Porque X tiene una distribución normal y quieres una probabilidad, la conexión es la Z-fórmula: Z = (X - # 956-) /# 963-. Usted tiene una buena idea de que ésta es la fórmula correcta, ya que incluye todo lo que tiene: # 956-, # 963-, y el valor de X (que es 90). Encontrar P(X lt; 90) = P[Z lt; (90 - 80) / 5] = P(Z lt; 2) = 0,9772. Voil # 224-!