Cómo usar filtros de colaboración basada en tema en análisis predictivo

Uno de los sistemas de recomendación de Amazon para usos de análisis predictivo filtrado colaborativo basado en elemento - repartiendo un gran inventario de productos procedentes de la base de datos de empresa, cuando un usuario ve un solo artículo en el sitio web. Usted sabe que usted está buscando en un sistema basado en elemento filtrado colaborativo (o, a menudo, un sistema basado en el contenido) si se muestra recomendaciones en su primera vista de elemento, incluso si usted no ha creado un perfil.

Parece magia, pero no lo es. Aunque su perfil no ha sido creada todavía (porque no has iniciado sesión o no tienes ningún historial de navegación anterior en ese sitio) el sistema toma lo que equivale a una conjetura: Basa su recomendación sobre el objeto mismo y lo que otros clientes vieron o compraron después (o antes) que compró ese elemento. Por lo que usted ve algún mensaje en pantalla como

  • Los clientes que compraron este artículo también compraron . . .

  • Los clientes que compraron artículos en su historia reciente también han comprado. . .

  • ¿Qué otros artículos compran los clientes después de ver este artículo?

En esencia, la recomendación se basa en la similitud del tema que se está viendo es que otros elementos, sobre la base de las acciones de la comunidad de usuarios.

A continuación se muestra una matriz de la muestra de los clientes y los artículos que compraron. Se utilizará como un ejemplo de filtrado colaborativo basado en elemento.

ClienteArtículo 1Artículo 2Artículo 3Artículo 4Tema 5Artículo 6
LAXXX
BXX
C X X
D XXX
E XX
FXX XX
GX X
HX
yo X

Ahora echemos un vistazo a la similitud elemento calculado mediante la fórmula similitud del coseno. La fórmula para coseno similitud es un middot- B) / (A || || || || B), donde A y B son artículos para comparar. Para leer el siguiente ejemplo y averiguar cómo es similar un par de artículos son, simplemente busque la celda en la que los dos elementos se cruzan. El número estará entre 0 y 1. Un valor de 1 significa que los artículos son perfectamente similitud 0 significa que no son similares.

Artículo 600000
Tema 50.260.290.520.82 0
Artículo 40.320.350.32 0.820
Artículo 30.400.45 0.320.520
Artículo 20.67 0.450.350.290
Artículo 1 0.670.400.320.260
Artículo 1Artículo 2Artículo 3Artículo 4Tema 5Artículo 6

El sistema puede proporcionar una lista de recomendaciones que están por encima de un cierto valor de similitud o puede recomendar la parte superior n número de items. En este escenario, se puede decir que cualquier valor mayor o igual a 0,40 se similitud del sistema recomendará esos artículos.

Por ejemplo, la similitud entre el punto 1 y el punto 2 es 0,67. La similitud entre el punto 2 y el punto 1 es el mismo. Por lo tanto se trata de una imagen de espejo a través de la diagonal desde abajo a la izquierda a la superior derecha. También puede ver que el tema 6 no es similar a cualquier otro artículo, ya que tiene un valor de 0.

Esta implementación de un sistema de recomendación basado en la partida se ha simplificado para ilustrar cómo funciona. Para simplificar, sólo se utilice un criterio para determinar la similitud elemento: si el usuario compró el artículo. Más complejos sistemas podrían entrar en mayor detalle por

  • Uso de perfiles creados por los usuarios que representan sus gustos

  • Factoring en la cantidad de s de usuario le gusta (o altamente tasas) un artículo

  • Pesaje cuántos elementos han comprado el usuario que son similares al potencial elemento recomendada (s)

  • Hacer suposiciones acerca de si un usuario le gusta un tema sobre la base de si el usuario simplemente ha visto el tema, a pesar de que no se hizo la compra

Estas son dos formas comunes que usted podría utilizar este sistema de recomendación:

  • Desconectado través de una campaña de marketing por correo electrónico, o si el usuario se encuentra en la página web mientras está conectado.

    El sistema podría enviar anuncios de marketing o hacer estas recomendaciones en el sitio web:

  • Tema 3 a cliente B

    Recomendado porque Cliente B comprar artículos 1 y 2, y ambos elementos son similares a Tema 3.

  • Artículo 4, a continuación del artículo 2, al cliente C

    Recomendado porque Cliente C compró artículos 3 y 5 del artículo 5 es similar al Artículo (valor de similitud: 0,82) 4. Tema 2 es similar al Artículo (valor de similitud: 0,45) 3.

  • Tema 2 al cliente D

    Recomendado porque cliente D compró artículos 3, 4 y 5. Artículo 3 es similar a la del artículo 2.

  • Artículo 1 al Cliente E

    Recomendado porque Cliente E Los artículos comprados 2 y 3, los cuales son similares a los del artículo 1.

  • Tema 3 al cliente F

    Recomendado porque Cliente F compró artículos 1, 2, 4 y 5. Los artículos 1, 2, y 5 son similares a los del artículo 3.

  • Tema 2 al cliente G

    Recomendado porque cliente G compró artículos 1 y 3. Ellos son a la vez similar a la del artículo 2.

  • Artículo 2, continuación del artículo 3, al Cliente H

    Recomendado porque Cliente H comprado Artículo 1. El artículo 1 es similar a los Artículos 2 y 3.

  • Elemento indeterminado al Cliente A

    Idealmente, usted debe tener mucho más elementos y usuarios. Y debe haber algunos elementos que un cliente ha comprado que son similares a otros artículos que él o ella aún no ha comprado.

  • Punto indeterminado de cliente I

    En este caso, los datos son insuficientes para servir como la base de una recomendación. Este es un ejemplo del problema de arranque en frío.

  • En línea a través de una vista de la página, mientras que el usuario no está conectado.




  • » » » » Cómo usar filtros de colaboración basada en tema en análisis predictivo