¿Cómo describir el centro de datos continuos en r

Usted tiene el conjunto de datos y de haber formateado para que se ajuste a sus necesidades en I, por lo que ahora usted está listo para el trabajo real. Analizando los datos siempre se inicia con la descripción de la misma. De esta manera usted puede detectar errores en los datos, y usted puede decidir qué modelos son apropiados para obtener la información que necesita de los datos que tiene.

Qué descriptiva estadísticas que utilice dependerá de la naturaleza de los datos, por supuesto.

A veces estás más interesado en el cuadro general de los datos de lo que está en los valores individuales. Es posible que no está interesado en el kilometraje de cada coche, pero en el kilometraje medio de todos los vehículos a partir de ese conjunto de datos. Para ello, se calcula la media utilizando la significa () función, así:

> Media (coches $ mpg) [1] 20.09062

También puede calcular el número medio de cilindros de esos coches tienen, pero esto no tiene mucho sentido. El promedio sería de 6.1875 cilindros, y no hay coches conducir con un cilindro incompleta. En este caso, el mediana - el valor central de la mayoría de sus datos - tiene más sentido. Usted obtiene la mediana del uso de la función mediana (), Me gusta esto:

> Mediana (automóviles $ cil) [1] 6

Hay numerosas otras razones para el cálculo de la mediana en lugar de la media, o incluso ambos juntos. Ambas estadísticas describen una propiedad diferente de sus datos, e incluso la combinación se puede decir algo.




» » » » ¿Cómo describir el centro de datos continuos en r