Cómo utilizar las frecuencias o densidades con sus datos en r
Al romper seguridad de sus datos en intervalos de R, usted todavía pierde alguna información. Sin embargo, la forma más completa de la descripción de sus datos es mediante la estimación de la la función de densidad de probabilidad
(PDF) o densidad de la variable.Si este concepto es desconocido para usted, no se preocupe. Sólo recuerde que la densidad es proporcional a la probabilidad de que cualquier valor en sus datos es aproximadamente igual a ese valor. De hecho, para un histograma, la densidad se calcula a partir de los recuentos, por lo que la única diferencia entre un histograma con frecuencias y una con densidades, es la escala de la y-eje. Para el resto, se ven exactamente lo mismo.
Cómo crear un gráfico de densidad
Se puede estimar la función de densidad de una variable utilizando el densidad () función. La salida de esta función en sí no dice mucho, pero se puede utilizar fácilmente en una parcela. Por ejemplo, usted puede conseguir la densidad de la variable de kilometraje mpg Me gusta esto:
> Mpgdens lt; - densidad (coches $ mpg)
El objeto se obtiene de esta manera es una lista que contiene una gran cantidad de información que usted realmente no necesita mirar. Pero esa lista hace trazando la densidad tan fácil como decir " parcela la densidad # 148 ;:
> Argumentales (mpgdens)
La trama se parece un poco peligrosa en los bordes, pero lo importante es ver cómo sus datos sale. El objeto de densidad se representa como una línea, con los valores reales de los datos sobre el X-eje y la densidad en el y-eje.
los mpgdens lista de objetos contiene - entre otras cosas - un elemento llamado X Y el uno y. Estos representan la X- y y-coordenadas para trazar la densidad. Cuando R calcula la densidad, la densidad () función divide los datos en una serie de pequeños intervalos y calcula la densidad para el punto medio de cada intervalo. Esos puntos medios son los valores para X, y las densidades calculados son los valores para y.
Cómo trazar densidades en un histograma
Recuerde que la hist () función devuelve el recuento para cada intervalo. Ahora la probabilidad de que un valor se encuentra dentro de un cierto intervalo es directamente proporcional a los recuentos. Los más valores que tienen dentro de un cierto intervalo, mayor será la posibilidad de que cualquier valor que eligió está mintiendo en ese intervalo.
Así, en lugar de planear los recuentos en el histograma, usted podría así trazar las densidades. R hace todos los cálculos para usted - la única cosa que hay que hacer es establecer la frec argumento de hist () a FALSO, Me gusta esto:
> Hist (automóviles $ mpg, col = "gris", frec = FALSO)
Ahora la trama se verá exactamente lo mismo que para antes sólo los valores de la y-eje son diferentes. La escala de la y-eje está configurado de tal manera que se puede añadir la trama densidad sobre el histograma. Para ello, se utiliza el líneas() funcionar con el objeto de densidad como argumento.
Así, se puede, por ejemplo, de lujo hasta el histograma anterior un poco más lejos al añadir la densidad estimada usando el siguiente código inmediatamente después del comando anterior:
> Líneas (mpgdens)
Verá el resultado de estos dos comandos en el lado derecho. Recuerda que líneas() utiliza el X y y elementos del objeto de la densidad mpgdens para trazar la línea.