Fusión y anexar los datos

Cuando los datos están en más de un lugar, necesita maneras de poner todo junto. Cuando se une a dos conjuntos de datos con diferentes variables, eres la fusión datos. La fusión es una operación común. La fusión se utiliza con frecuencia en la minería de datos, combinando datos vinculados como

  • Los registros de clientes y datos de la campaña de comercialización

  • Antes y después de los resultados de pruebas

  • Los datos internos y proveedores

Para combinar conjuntos de datos, debe tener una variable que identifica casos de matching- esto se llama un llave o identificador variable. Y puede que tenga que identificar a uno de los conjuntos de datos como de primaria la tabla principal debe tener sólo un caso para cualquier valor de la variable clave.

Algunas aplicaciones de minería de datos tienen más de una herramienta para combinar conjuntos de datos: La primera figura muestra la herramienta para combinaciones básicas, y la segunda figura muestra la herramienta para la creación de criterios de combinación más complejos.

imagen0.jpgimage1.jpg

Si sus fuentes de datos contienen las mismas variables (más o menos- el partido no tiene por qué ser idénticos), pero diferentes casos, uniéndose a ellos se llama anexando o concatenación. Como fusión, esta es una operación común. Ha utilizado cada vez que tenga nuevos casos por algo que ya has estado siguiendo.

image2.jpg

La parte difícil de encontrar la herramienta adecuada a menudo es averiguar cómo se llama. Busque en los menús (o buscar) para añadir, concatenar, o fusionar filas.




» » » » Fusión y anexar los datos