Cómo aplicar las agrupaciones de colonias en el análisis predictivo

Un ejemplo natural de grupo de auto-organización puede aplicar en el comportamiento de análisis predictivo es una colonia de hormigas de caza para la alimentación. Las hormigas optimizar colectivamente su pista para que siempre toma el camino más corto a un objetivo alimentos.

Incluso si intenta molestar a una colonia de marcha de las hormigas y les impiden llegar a la meta de alimentos que volver a la pista rápida y (de nuevo) de encontrar el camino más corto posible a la meta de alimentos, todos ellos evitar los mismos obstáculos en la búsqueda de los alimentos. Esta uniformidad de comportamiento es posible porque cada depósitos de hormigas un rastro de feromonas sobre el terreno.

Considere la posibilidad de un ejército de hormigas ociosos en su nido. Cuando empiezan a buscar comida, no tienen absolutamente ninguna información sobre dónde encontrarlo. Marchan al azar hasta una hormiga individuo encuentra comida- ahora la suerte de hormigas (llamémosle X Ant) tiene que comunicar su hallazgo al resto de las hormigas - y para hacer eso, debe encontrar su camino de regreso al nido.

Afortunadamente, Ant X estaba produciendo sus propias feromonas todo el tiempo que estaba buscando comida- puede seguir su propio rastro de feromonas de vuelta al nido. En su camino de vuelta al nido, siguiendo su propio rastro de feromonas, Ant X pone más feromonas en el mismo sendero.

Como resultado, el olor en el rastro de la hormiga X será el más fuerte entre todos los senderos de las otras hormigas. El sendero más fuerte de feromonas atraerá todas las otras hormigas que todavía están en busca de comida. Ellos siguen el olor más fuerte. A medida que más hormigas se unen el rastro de la hormiga X, añaden más feromonas para IT- el olor se vuelve más fuerte. Muy pronto, el resto de las hormigas tienen un olor fuerte como para seguir.

Si varias hormigas han descubierto la misma fuente de alimentación, las hormigas que tomaron el camino más corto a hacer más viajes en comparación con las hormigas que siguen trayectorias más largas - por lo tanto, más feromonas se produjeron en la ruta más corta. La relación entre el comportamiento individual y colectivo es un ejemplo natural esclarecedor.

Cada punto representa un documento. Suponga que los puntos negros son los documentos sobre análisis predictivo y los puntos blancos son documentos sobre antropología. Puntos que representan los diferentes tipos de documentos se distribuyen al azar en la cuadrícula de cinco células.

" Hormigas " se despliegan de forma aleatoria en la red para buscar documentos similares. Cada célula con un valor en que representa una instancia de una ". Feromona " Utilizando la matriz documento, cada celda de " feromona " valor se calcula a partir del documento correspondiente.

imagen0.jpg

De acuerdo, ¿cómo la inteligencia colectiva de una colonia de hormigas producen un modelo para agrupar eficazmente los datos? La respuesta está en una simple analogía: Las hormigas están en busca de comida en su entorno, tanto como nosotros estamos en busca de cúmulos en un conjunto de datos - en busca de documentos similares dentro de un gran conjunto de documentos.

Considere un conjunto de datos de los documentos que desee organizar por temas. Documentos similares se agrupan en el mismo grupo. Aquí es donde la colonia de hormigas puede proporcionar pistas sobre cómo agrupar documentos similares.

Imagine un (2D) rejilla de dos dimensiones donde se puede representar documentos como puntos. La rejilla 2D se divide en células. Cada célula tiene una " feromona " (valor) asociado con él. Brevemente, el " feromona " valor distingue cada documento en una célula dada.

Los puntos se distribuyen inicialmente al azar - y cada punto en la cuadrícula representa un documento único. El siguiente paso consiste en implementar otros puntos al azar en la parrilla 2D, simulando la búsqueda de la colonia de hormigas para la comida en su entorno. Esos puntos se encuentran dispersos inicialmente en la misma cuadrícula 2D con los documentos.

Cada nuevo punto añadido a la red representa una hormiga. Aquellas " hormigas, " a menudo se hace referencia en el algoritmo de colonia de hormigas como agentes, se están moviendo en la cuadrícula 2D. Cada " hormiga " , o bien recoger o dejar a los otros puntos (documentos), dependiendo de donde los documentos mejores pertenecen. En esta analogía, el " alimentos " toma la forma de documentos suficientemente similares que pueden ser agrupados.

Un " hormiga " paseos al azar en el GRID si encuentra un documento, puede realizar una de dos acciones: escoja o soltar. Cada célula tiene una " feromona intensidad " que indica la similitud del documento es a los otros documentos (puntos) que residen cerca del documento en cuestión - el que un " hormiga " está a punto de ya sea recoger o dejar.

Tenga en cuenta que la " hormiga " en la Celda 3 recogerá el documento-negro salpicado porque el blanco " feromona " valor es dominating- y mover a una celda donde el valor está cerca (similar) para lo que está en la celda 4 (varios puntos negros). La búsqueda continúa iterando hasta que se formen los grupos.

image1.jpg

En efecto, el " hormiga " mueve los documentos de una celda a otra para formar grupos mediante la realización de cualquiera de las dos únicas acciones: recoger un documento o dejar caer un documento.

Cuando el " hormigas " comenzado a moverse al azar en la red, encontrando un punto (documento) se traduce en la " hormiga " recoger un documento de su celda actual, que se mueve con ella, y colocándolo en una célula en la que tenía similitud suficiente para encajar.

¿Cómo sería un " hormiga " determinar la mejor celda en la que dejar caer un documento? La respuesta es que los valores de las celdas actúan como " feromonas " - Y cada celda de la cuadrícula 2D contiene un valor numérico que se puede calcular de una manera que representa un documento en la célula.

Recuerde que cada documento se representa como un conjunto de números o un vector de valores numéricos. los " la intensidad de la feromona " (el valor numérico) aumenta cuando más documentos se dejan caer en la celda - y ese valor disminuye si los números que representan los documentos se mueven fuera de la célula.




» » » » Cómo aplicar las agrupaciones de colonias en el análisis predictivo