Cómo contar los valores de datos únicos en r

Para averiguar qué datos pueden tenerse en cuenta cuando se trabaja en R, vamos a echar un vistazo a la base de datos mtcars. Este conjunto de datos incorporada describe el consumo de combustible y diez puntos diferentes de diseño de 32 coches de la década de 1970. Contiene, en total, 11 variables, pero todos ellos son numéricos.

Aunque usted puede trabajar con la trama de datos como es, algunas variables se podrían convertir en un factor, ya que tienen una cantidad limitada de valores.

Si usted no sabe cuántos valores diferentes de una variable tiene, puede obtener esta información en dos sencillos pasos:

  1. Obtener los valores únicos de la variable usando único ().

  2. Obtener la longitud del vector resultante utilizando largo().

Usando el sapply () función, puede hacer esto por toda la trama de datos a la vez. Aplica una función anónima que combina los dos pasos mencionados en toda la trama de datos, como este:

> Sapply (mtcars, la función (x) longitud (único (x))) mpg Cil disp hp drat en peso QseC vs carb25 am engranaje 3 27 22 22 29 30 2 2 3 6

Así, parece que las variables cil, vs, soy, engranaje, y carbohidratos pueden beneficiarse de una conversión a factor.

Usted tiene 32 observaciones diferentes en ese conjunto de datos, por lo que ninguna de las variables sólo tiene valores únicos.

Cuando para tratar una variable como un factor depende un poco de la situación, pero, por regla general, evite más de diez niveles diferentes en un factor y tratar de tener por lo menos cinco valores por nivel.




» » » » Cómo contar los valores de datos únicos en r