¿Cómo eliminar datos duplicados en r

Una aplicación muy útil de subconjuntos de datos es encontrar y eliminar valores duplicados. R tiene una función útil, duplicado (), que encuentra valores duplicados y devuelve un vector lógico que indica si el valor específico es un duplicado de un valor anterior. Esto significa que para valores duplicados, duplicado () devoluciones FALSO por primera ocurrencia y CIERTO para cada siguiente ocurrencia de ese valor, como en el siguiente ejemplo:

> Duplicado (c (1,2,1,3,1,4)) [1] false false false VERDADERO FALSO VERDADERO

Si intenta esto en un marco de datos, R comprueba automáticamente las observaciones (es decir, que trata a cada fila como un valor). Así, por ejemplo, con la trama de datos iris:

> Duplicado (iris) [1] false false false false false false false false false [10] false false false false false false false false false .... [136] false false false false false false FALSO VERDADERO FALSO [145] FALSO FALSO FALSE false false false

Si se fijan bien, observa que la fila 143 es un duplicado (porque el elemento 143a de su resultado tiene el valor CIERTO). También puede contar esta utilizando el cual() función:

> Que (duplicado (iris)) [1] 143

Ahora, para eliminar el duplicado de iris, que necesita para excluir esta fila de sus datos. Recuerde que hay dos formas de excluir datos utilizando subconjuntos:

Especifique un vector lógico, donde FALSO significa que se excluirá del elemento. los ! (signo de exclamación) operador es una negación lógica. Esto significa que se convierte CIERTO dentro FALSO y viceversa. Por lo tanto, para eliminar los duplicados de iris, hace lo siguiente:
```
> Iris [! Duplicados (iris),]
```
Especifique los valores negativos. En otras palabras:

> Índice lt; - que (duplicados (iris))> iris [-índice,]

En ambos casos, se dará cuenta de que su instrucción ha eliminado fila 143.

Sobre el autor

El tipo de datos booleano en javascript

El tipo de datos Boolean en javascript puede almacenar uno de dos valores posibles: cierto o falso. Valores booleanos son el resultado cuando lo hagas comparaciones en javascript. Si le preguntas a javascript algo como: "Es 3 igual a…

Matlab Resumen operador común

Usted necesita saber que los operadores apoya MATLAB, pero les recuerda que no todo es fácil. La siguiente tabla ofrece un breve resumen de los operadores que MATLAB soporta.OperadorEscribeDescripciónEjemplo-AritméticaResta el operando derecho…

10 cosas que usted puede hacer en r que usted ha hecho en microsoft excel

La hoja de cálculo es probablemente una de las aplicaciones de PC más utilizados - y por una buena razón: Las hojas de cálculo hacen que sea muy fácil de realizar cálculos y otras operaciones en los datos tabulares. Pero las hojas de cálculo…

Cómo r calcula valores infinitos, no definidos, y que faltan

Por suerte, R puede hacer frente a anomalías de los datos que confunden algunas otras plataformas estadísticos. Por ejemplo, en algunos casos, usted no tiene valores reales para calcular con. En la mayoría de los conjuntos de datos de la vida…

¿Cómo combinar los estados lógicos en r

La vida sería aburrida en I si usted no podría combinar declaraciones lógicas. Si desea comprobar si un número se encuentra dentro de un cierto intervalo, por ejemplo, desea comprobar si es mayor que el valor más bajo y menor que el valor de la…

Cómo comparar los valores en los vectores lógicos en r

Para construir vectores lógicos en R, es mejor que sepa cómo comparar valores y R contiene un conjunto de operadores que se pueden utilizar para este propósito.OperadorResultadox == yDevoluciones CIERTO si X exactlyequals y! x = yDevoluciones…

¿Cómo extraer variables, observaciones, y los valores de una trama de datos en r

En muchos casos, puede extraer los valores de una trama de datos en I fingiendo que es una matriz. Pero a pesar de las tramas de datos pueden parecer matrices, que definitivamente no lo son. A diferencia de las matrices y matrices, cuadros de datos…

Cómo manejar el infinito en r

En algunos casos, usted no tiene valores reales para calcular con. En la mayoría de los conjuntos de datos de la vida real en R, de hecho, por lo menos unos pocos valores que faltan. Además, algunos cálculos tienen como resultado el infinito…

Cómo subconjunto tramas de datos en r

Ahora que ha revisado las reglas para la creación de subconjuntos, puede probar con algunas tramas de datos en R. Sólo tienes que recordar que una trama de datos es un objeto bidimensional y contiene filas, así como columnas. Esto significa que…

Cómo utilizar las dimensiones para extraer los valores de una matriz de r

La extracción de valores de una matriz en R con cualquier número de dimensiones es completamente equivalente a la extracción de valores de una matriz. Separar los índices de los componentes que desea recuperar con comas.Si es necesario se puede…

Cómo utilizar vectores lógicos como índices en r

La función de índice en I no toma sólo vectores numéricos como arguments- también trabaja con vectores lógicos. Puede utilizar estos vectores lógicos de manera muy eficiente para seleccionar algunos valores de un vector.Si utiliza un vector…

Cómo utilizar vectorización con sentencias if en r

Vectorización es uno de los atributos que definen el lenguaje R. R no sería de R si no tenía algún tipo de versión vectorizada de un if ... else comunicado.El problemalos priceCalculator () función todavía no es muy económico. Si usted tiene…

maniqui-es.com » Computadoras y software » Programación » R » ¿Cómo eliminar datos duplicados en r