Cómo usar factores o datos numéricos en r

Antes de intentar describir sus datos en R, usted tiene que asegurarse de que sus datos están en el formato correcto. Esto significa

  • Asegurarse de que todos sus datos están contenidos en una trama de datos (o en un vector de si se trata de una sola variable)

  • Asegurar que todas las variables son del tipo correcto

  • Verificar que los valores están procesados ​​correctamente

Algunos de los datos pueden tener sólo un número limitado de valores diferentes. Por ejemplo, la gente puede ser hombre o mujer, y usted puede describir a la mayoría de tipos de cabello con sólo unos pocos colores.

A veces más valores son teóricamente posible, pero no es realista. Por ejemplo, los coches pueden tener más de 16 cilindros en sus motores, pero no vas a encontrar muchos de ellos. De una forma u otra, todos estos datos pueden ser vistos como categórico. Según esta definición, los datos categóricos también incluye datos ordinales.

Por otro lado, tiene datos que pueden tener una cantidad ilimitada de valores posibles. Esto no significa necesariamente que los valores pueden ser cualquier valor que quiera. Por ejemplo, el kilometraje de un coche se expresa en millas por galón, normalmente se redondea a toda la milla. Sin embargo, el valor real será ligeramente diferente para cada coche.

Lo único que define el número de valores posibles se permite es la precisión con la que usted expresa los datos. Los datos que puede ser expresado con cualquier nivel deseado de precisión es continuo. Tanto los datos de intervalo en escala y los datos de relación en escala suelen ser los datos continuos.

La distinción entre los datos categóricos y continuo no siempre está claro sin embargo. La edad es, en esencia, una variable continua, pero a menudo se expresa en el número de años transcurridos desde el nacimiento.

Usted todavía tiene una gran cantidad de valores posibles, si haces eso, pero ¿qué pasa si nos fijamos en la edad de los niños en su escuela secundaria local? De repente usted tiene sólo cinco, tal vez de seis, valores diferentes en sus datos. En ese momento, usted puede obtener más de su análisis, si usted trata a esos datos tan categórica.

Al describir los datos, es necesario hacer la distinción entre los datos que se beneficia de ser convertido en un factor y los datos que necesita para mantenerse numérico. Si usted puede ver sus datos categóricos, convirtiéndola en un factor de ayuda con el análisis de la misma.




» » » » Cómo usar factores o datos numéricos en r