Cómo visualizar el análisis predictivo "datos brutos
Una imagen vale más que mil palabras - especialmente cuando usted está tratando de conseguir un buen control sobre sus datos de análisis predictivos. En la etapa de pre-procesamiento, mientras que usted se está preparando sus datos, es una práctica común de visualizar lo que tienes en la mano antes de continuar con el siguiente paso.
Conteúdo
- Cómo utilizar visualizaciones tabulares para el análisis predictivo
- Los gráficos de barras utilizan en el análisis predictivo
- Conceptos básicos de gráficos de sectores para el análisis predictivo
- Cómo utilizar cartas gráficas para el análisis predictivo
- Conceptos básicos de nubes de palabras para el análisis predictivo
- Cómo utilizar acuden aves representación para el análisis predictivo
Se empieza por el uso de una hoja de cálculo como Microsoft Excel para crear una matriz de datos - que consta de datos de candidatos Características (también conocida como atributos). Varios paquetes de software de inteligencia de negocios (como Tableau) le puede dar una visión preliminar de los datos a los que usted está a punto de aplicar la analítica.
Cómo utilizar visualizaciones tabulares para el análisis predictivo
Las tablas son la representación gráfica más sencilla, más básico de datos. Tablas (también conocido como hojas de cálculo) Consisten en filas y columnas - que corresponden, respectivamente, a los objetos y sus atributos mencionados anteriormente como hacer de sus datos. Por ejemplo, considere los datos de redes sociales en línea. Un objeto de datos puede representar a un usuario. Atributos de un usuario (objeto de datos) pueden ser títulos de columnas: sexo, código postal, o fecha de nacimiento.
Las celdas de una tabla representan valores. Visualización en tablas puede ayudar a detectar fácilmente los valores de atributos faltantes de objetos de datos.
Las tablas también pueden proporcionar la flexibilidad de añadir nuevos atributos que son combinaciones de otros atributos. Por ejemplo, en los datos de redes sociales, se puede añadir otra columna llamada Edad, que se puede calcular fácilmente - como un atributo derivado - a partir de la fecha actual del atributo de nacimiento. Lo social de la red de datos de tabla muestra una nueva columna, Edad, creada a partir de otra columna existente (Fecha de Nacimiento).
Los gráficos de barras utilizan en el análisis predictivo
Los gráficos de barras se pueden usar para detectar picos o anomalías en los datos. Se puede utilizar para cada atributo de la imagen de forma rápida los valores mínimo y máximo. Los gráficos de barras se pueden también utilizar para iniciar una discusión sobre cómo normalizar sus datos.
Normalización es el ajuste de algunos - o todos - los valores de atributos en una escala que hace que los datos más usable. Por ejemplo, usted puede fácilmente ver que hay un error en los datos: La barra de edad en un registro es negativo. Esa anomalía es más fácilmente representado por un gráfico de barras que por una tabla de datos.
Conceptos básicos de gráficos de sectores para el análisis predictivo
Los gráficos circulares se utilizan principalmente para mostrar porcentajes. Pueden ilustrar fácilmente la distribución de varios elementos, y poner de relieve el más dominante. Los datos en bruto de red social está representado de acuerdo con el atributo de Edad. Observe que el gráfico muestra no sólo una clara distribución de los varones frente a las mujeres, sino también un error probable: R como tipo posiblemente creado un valor para el género cuando se recogieron los datos.
Cómo utilizar cartas gráficas para el análisis predictivo
La teoría de grafos proporciona un conjunto de potentes algoritmos que pueden analizar datos estructurados y representados en forma de gráfico. En informática, un gráfico es la estructura de datos, una forma de organizar los datos que representan las relaciones entre pares de objetos de datos. Un gráfico se compone de dos partes principales:
Vértices, también conocido como nodos
Bordes, que conectan pares de nodos
Los bordes pueden ser dirigida (dibujado como flechas) y pueden tener pesos. Usted puede decidir colocar un borde (flecha) entre dos nodos (círculos) - en este caso, los miembros de la red social que conecta a otros miembros como amigos:
Dirección de la flecha indica la OMS "amigos" a quien primero, o que inicia interacciones mayor parte del tiempo.
Conceptos básicos de nubes de palabras para el análisis predictivo
Considere una lista de palabras o conceptos dispuesto como una Nube de la palabra - una representación gráfica de todas las palabras de la lista, que muestra el tamaño de cada palabra como proporcional a una métrica que especifique. Por ejemplo, si usted tiene una hoja de cálculo de las palabras y las ocurrencias y desea identificar las palabras más importantes, intente una nube de palabras.
Nubes de la palabra funcionan porque los datos de la mayoría de las organizaciones es texto- un ejemplo común es el uso de Twitter de trending términos. Cada término en esta representación tiene un peso que afecta a su tamaño como un indicador de su importancia relativa.
Una forma de definir que el peso podría ser por el número de veces que una palabra aparece en la recopilación de datos. Aparece la mayor frecuencia una palabra, el "más pesado" su peso - y cuanto más grande aparece en la nube.
Cómo utilizar acuden aves representación para el análisis predictivo
Comportamiento que acuden natural en general, es un sistema de auto-organización en la que los objetos (en particular, los seres vivos) tienden a comportarse de acuerdo con (a) el entorno al que pertenecen y (b) sus respuestas a otros objetos existentes. El comportamiento de las sociedades que acuden naturales como los de las abejas, moscas, aves, peces, y las hormigas - o, para el caso, la gente - es también conocido como inteligencia de enjambre.
Las aves siguen reglas naturales cuando se comportan como un rebaño. Flock compañeros Son aves localizadas con cierta distancia uno de otro- esos pájaros se consideran similares. Cada movimientos de aves de acuerdo con las tres reglas principales que organizan el comportamiento que acuden.
Separación: Flock-compañeros no deben chocar entre sí.
Alineación: Flock-compañeros a moverse en la misma dirección la media, como sus vecinos.
Cohesión: Flock-compañeros se mueven de acuerdo a la posición media o ubicación de sus compañeros de manada.
Modelado de esas tres reglas puede permitir un sistema analítico para simular comportamientos que acuden. Utilizando el comportamiento natural de auto-organizada de las aves que acuden, puede convertir una hoja de cálculo sencilla en una visualización. La clave es definir la noción de similitud en el marco de sus datos. Comience con un par de preguntas:
Lo que hace que los objetos de datos en dos de sus datos similar?
¿Qué atributos pueden conducir mejor la similitud entre dos registros de datos?
Por ejemplo, en los datos de redes sociales, los registros de datos representan individuo usuarios- los atributos que los describen pueden incluir Edad, Código Postal, Estado civil, Lista de Amigos, número de amigos, hábitos, Eventos