¿Cómo lidiar con los valores de datos faltantes en r

los cor () función en R puede lidiar con la falta de valores de datos de múltiples maneras. Para ello, establece el argumento usar a uno de los posibles valores de texto. El valor de la usar argumento es especialmente importante si usted calcula las correlaciones de las variables en un marco de datos. Al establecer este argumento para diferentes valores, puede

  • Utilice todas las observaciones mediante el establecimiento de utilizar = 'todo'. Esto significa que si hay alguna N / A valor en una de las variables, la correlación resultante es N / A así como. Este es el valor predeterminado.

  • Excluir todas las observaciones que tienen N / A para al menos una variable. Para ello, se establece utilizar = 'complete.obs'. Tenga en cuenta que esto te puede dejar con sólo unas pocas observaciones si los valores perdidos se propagan a través del conjunto de datos completo.

  • Excluir observaciones con N / A valores para cada par de variables lo examinará. Para ello, establece el argumento utilizar = 'pares'. Esto asegura que se puede calcular la correlación para cada par de variables sin perder información debido a los valores que faltan en las otras variables.

De hecho, se puede calcular diferentes medidas de correlación. De forma predeterminada, R calcula el coeficiente de correlación de Pearson estándar. Para los datos que no se distribuye normalmente, puede utilizar la cor () función para calcular el grado de correlación de Spearman, o tau de Kendall. Para ello, hay que establecer el método argumento al valor apropiado.




» » » » ¿Cómo lidiar con los valores de datos faltantes en r