Cómo utilizar grupos multitud de aves en el análisis predictivo
Imagínese comportamiento acuden aves como modelo de datos de análisis predictivo de su empresa. Cada elemento de datos corresponde a un solo pájaro en el flock- una aplicación visual apropiado puede mostrar el rebaño en la acción en un espacio visual imaginario.
Su conjunto de datos se corresponde con el rebaño. El comportamiento que acuden naturales corresponde a patrones de datos que de otro modo podrían pasar sin descubrir. El objetivo es detectar enjambres (clusters de datos) entre las aves que acuden (elementos de datos).
Flocado comportamiento se ha utilizado en aplicaciones de la vida real, tales como operaciones de rescate de robótica basada y la animación por ordenador. Por ejemplo, el productor de la película Batman Returns comportamiento que acuden matemática generada para simular enjambres de murciélagos y bandadas de pingüinos.
El uso de flocado comportamiento como una técnica de análisis predictivo - el análisis de datos de una empresa como bandadas de elementos de datos similares - se basa en la dinámica detrás acuden comportamiento tal como aparece en la naturaleza.
Flocado comportamiento de las aves, peces, moscas, abejas, hormigas y es un auto-organización sistema- los individuos tienden a moverse de acuerdo tanto con su medio ambiente y las personas vecinas.
En una bandada de pájaros, cada ave se aplica tres reglas principales, mientras que acuden:
Separación mantiene un pájaro aparte de sus compañeros de manada más cercanas.
Alineamiento permite que un pájaro se mueva a lo largo de la misma partida la media, como la de sus compañeros de manada.
Cohesión mantiene el ave en el rebaño local.
Cada pájaro en un rebaño se mueve de acuerdo a estas normas. De pájaro compañeros de rebaño son aves que se encuentran a una cierta distancia del ave, y una cierta distancia unos de otros. Para evitar la colisión entre las aves, una distancia mínima debe ser cuidada, también puede ser define matemáticamente. Tales son las normas que orquestan acuden conductismo utilizarlos para analizar los datos es un paso natural.
Considere un conjunto de datos de usuarios de redes sociales en línea. Agrupamiento de datos puede identificar comunidades sociales que comparten los mismos intereses. La identificación de las comunidades sociales en una red social es una herramienta valiosa que puede transformar cómo las organizaciones piensan, actúan, operar y gestionar sus estrategias de marketing.
¿Cómo se obtiene un conjunto de datos de usuarios de redes sociales? Bueno, algunos de los datos y las herramientas ya están disponibles: las redes sociales principales y sitios web de micro-blog como Facebook y Twitter proporcionan una interfaz de programación de aplicaciones (API) que le permite desarrollar programas que pueden obtener los datos públicos enviados por los usuarios.
Esas APIs que ofrece Twitter se conocen como Twitter Streaming API. Vienen en tres tipos principales: público, usuario y flujos de sitio:
Arroyos Públicas permitir a un usuario para recoger tweets públicos sobre un tema o un usuario específico, o apoyar a un propósito de análisis.
Corrientes de usuario permitir a un usuario para recoger tweets que son accesibles por cuenta del usuario.
Arroyos del sitio son para servidores de gran escala que se conectan a Twitter en nombre de muchos usuarios.
Ahora, supongamos que utiliza un programa para descargar los datos de los usuarios y organizarla en un formato tabular como la matriz que se muestra. Muestra una matriz simple que registra las interacciones en línea de amigos en línea de Zach más de dos semanas diferentes. Este conjunto de datos consta de siete elementos y siete características. Las características que se muestran en la columna de la tabla son el número de interacciones entre cada miembro y los demás miembros.
Hay muchas maneras de aplicar el comportamiento de aves que acuden a descubrir clusters en grandes conjuntos de datos. Una de las variaciones más recientes está el rebaño por el líder algoritmo de agrupamiento máquina de aprendizaje, inspirado por el descubrimiento de los líderes de aves en las especies de palomas. El algoritmo predice elementos de datos que potencialmente podrían conducir otro grupo de objetos de datos.
Se asigna un líder, y luego los iniciados líder y conduce el comportamiento de congregación. En el transcurso del algoritmo, los líderes pueden convertirse en seguidores o valores atípicos. En esencia, este algoritmo funciona de una manera que sigue las reglas de la "supervivencia del más apto".
El Rebaño por el algoritmo Líder fue introducido por primera vez por Abdelghani Bellaachia y Anasse Bari en "Rebaño por Líder: un algoritmo de agrupamiento Novela Machine Learning Biológicamente Inspirados", publicado como un capítulo en el procedimiento de los 2012 Los avances en la conferencia de Enjambre de Inteligencia.
A continuación se muestra una forma posible para representar los datos generados por los intercambios sociales en línea de más de dos semanas. Muestra que Zach interactuó 56 veces con Kellie y cinco veces con Arturo.
Miembro de la Red Social | Interacciones con John | Interacciones con Mike | Interacciones con Zach | Interacciones con Emma | Interacciones con Kellie | Interacciones con Nicole | Interacciones con Arthur |
---|---|---|---|---|---|---|---|
John | - | 10 | 10 | 12 | 4 | 4 | 10 |
Micro | - | 5 | 5 | 56 | 57 | 5 | |
Zach | - | 6 | 41 | 4 | 4 | ||
Emma | - | 28 | 8 | 8 | |||
Kellie | - | 5 | 5 | ||||
Nicole | - | 4 | |||||
Arturo | - |
Miembro de la Red Social | Interacciones con John | Interacciones con Mike | Interacciones con Zach | Interacciones con Emma | Interacciones con Kellie | Interacciones con Nicole | Interacciones con Arthur |
---|---|---|---|---|---|---|---|
John | - | 10 | 12 | 10 | 0 | 10 | 8 |
Micro | - | 50 | 2 | 0 | 0 | 5 | |
Zach | - | 9 | 0 | 1 | 3 | ||
Emma | - | 2 | 2 | 1 | |||
Kellie | - | 4 | 9 | ||||
Nicole | - | 1 | |||||
Arturo | - |
He aquí un ejemplo que describe cómo aplicar el algoritmo de aves que acuden para analizar los datos de redes sociales. Como se muestra, cada miembro está representado por un pájaro en el espacio virtual. Darse cuenta de
Las aves se dispersan inicialmente al azar en el espacio virtual.
Cada ave tiene una velocidad y una posición asociado con él.
Velocidad y posición se calculan para cada ave, el uso de tres vectores: separación, atracción, y de alineación.
Cada uno se mueve de aves de acuerdo con los tres vectores, y este movimiento produce el comportamiento flocado visto en la naturaleza.
Aquí los datos de interacción se analiza semanalmente para encontrar usuarios de redes sociales similares. Cada semana las aves se puede visualizar en una cuadrícula simple. Las posiciones de estas aves reflejan las interacciones de los individuos reales en el mundo real.