Conceptos básicos de filtros de análisis predictivo basados ​​en contenido

Basado en contenido

sistemas predictivos de análisis de recomendación en su mayoría coinciden Características (palabras clave etiquetadas) entre elementos similares y perfil del usuario para hacer recomendaciones. Cuando un usuario compra un artículo que se ha etiquetado características, serán recomendados elementos con características que coinciden con los del elemento original. Las más características coinciden, mayor será la probabilidad de que el usuario va a gustar la recomendación. Este grado de probabilidad se llama de precisión.

Conceptos básicos de las etiquetas para describir artículos

En general, la empresa que realiza la venta (o al fabricante) generalmente etiquetas que sus artículos con palabras clave. En el sitio web de Amazon, sin embargo, es bastante típico no volver a ver las etiquetas para los artículos comprados o vistos - y ni siquiera que se le pregunte para marcar un elemento. Los clientes pueden revisar los artículos que he comprado, pero eso no es lo mismo que el etiquetado.

Elementos de marcado pueden suponer un reto escala para una tienda como Amazon que tiene tantos artículos. Además, algunos atributos pueden ser subjetivas y pueden ser incorrectamente etiquetados, dependiendo de quién lo etiqueta. Una solución que resuelve el problema de escala es permitir a los clientes o al público en general para etiquetar los artículos.

Para mantener las etiquetas manejable y preciso, un conjunto aceptable de etiquetas puede ser proporcionada por el sitio web. Sólo cuando un número apropiado de usuarios de acuerdo (es decir, utilizan la misma etiqueta para describir un elemento), será la acordada etiqueta se utiliza para describir el artículo.

Etiquetado basado en el usuario, sin embargo, se vuelve a otros problemas de un sistema de filtrado basado en contenido (y filtrado colaborativo):

  • Credibilidad: No todos los clientes dicen la verdad (sobre todo en línea), y los usuarios que tienen sólo un pequeño historial de calificación pueden sesgar los datos. Además, algunos vendedores pueden dar (o animar a otros a dar) Las calificaciones positivas a sus propios productos mientras que da calificaciones negativas a los productos de sus competidores.

  • Escasez: No todos los artículos serán valorados o tendrán calificaciones suficientes para producir datos útiles.

  • Inconsistencia: No todos los usuarios usan las mismas palabras clave para etiquetar un elemento, a pesar de que el significado puede ser el mismo. Además, algunos atributos pueden ser subjetiva. Por ejemplo, un espectador de una película puede considerar corto mientras que otro dice que es demasiado larga.

Atributos necesitan definiciones claras. Un atributo con muy pocos límites es difícil evaluate imponer demasiadas reglas en un atributo se puede pedir a los usuarios que hacer demasiado trabajo, que disuadirlos de etiquetado de artículos.

Etiquetado de la mayoría de los artículos en un catálogo de productos puede ayudar a resolver el problema de arranque en frío que azota filtrado colaborativo. Durante un tiempo, sin embargo, la precisión de las recomendaciones del sistema será baja hasta que se crea o se obtiene un perfil de usuario.

Aquí hay una matriz de la muestra de los clientes y sus artículos comprados, muestra un ejemplo de filtrado basado en contenido.

ArtículosCaracterística 1Característica 2Característica 3Característica 4Característica 5
Artículo 1XX
Artículo 2XX
Artículo 3XXX
Artículo 4XXX
Tema 5XXX

En este caso, si un usuario le gusta Feature 2 - y que ha grabado en su perfil - el sistema recomendará todos los elementos que tienen Característica 2 en ellos: El artículo 1, punto 2, y el artículo 4.

Este enfoque funciona incluso si el usuario nunca ha comprado o revisado un artículo. El sistema sólo tiene que buscar en la base de datos de productos para cualquier artículo que ha sido etiquetado con Feature 2. Si (por ejemplo) a un usuario que esté buscando películas con Audrey Hepburn - y que la preferencia aparece en el perfil del usuario - el sistema de recomendará todo las películas que cuentan con Audrey Hepburn a este usuario.

Este ejemplo, sin embargo, expone rápidamente una limitación de la técnica de filtrado basado en contenido: El usuario probablemente ya sabe acerca de todas las películas que Audrey Hepburn ha estado en, o puede encontrar fácilmente - así que, desde el punto de ese usuario de vista, el sistema no ha recomendado algo nuevo o de valor.

¿Cómo mejorar la precisión con retroalimentación constante

Una forma de mejorar la precisión de las recomendaciones del sistema es preguntar a los clientes para la retroalimentación siempre que sea posible. El cobro de la retroalimentación del cliente se puede hacer de muchas maneras diferentes, a través de múltiples canales. Algunas empresas piden al cliente para evaluar un artículo o servicio después de la compra. Otros sistemas proporcionan enlaces al estilo de los medios sociales para que los clientes pueden " como " o " aversión " un producto. La interacción constante entre

¿Cómo medir la eficacia de las recomendaciones del sistema

El éxito de las recomendaciones de un sistema depende de lo bien que conoce a dos criterios: precisión (pensar en él como un conjunto de coincidencias perfectas - por lo general un pequeño conjunto) y recordar (pensar en él como un conjunto de posibles coincidencias - por lo general un conjunto más amplio). He aquí un vistazo más de cerca:

  • Precisión mide qué tan precisa fue la recomendación del sistema. La precisión es difícil de medir, ya que puede ser subjetivo y difícil de cuantificar. Por ejemplo, cuando un usuario visita primero el sitio de Amazon, Amazon puede saber a ciencia cierta si sus recomendaciones están en blanco?

    Algunas recomendaciones pueden conectar con los intereses del cliente, pero el cliente aún no se pueden comprar. La confianza más alto que una recomendación es precisa proviene de una evidencia clara: El cliente compra el artículo. Alternativamente, el sistema puede pedir explícitamente al usuario evaluar sus recomendaciones.

  • Recordar mide el conjunto de posibles buenas recomendaciones de su sistema se le ocurre. Piense en el recuerdo como un inventario de posibles recomendaciones, pero no todos ellos son recomendaciones perfectas. En general, existe una relación inversa con precisión y recordar. Es decir, como recuerdo sube, la precisión disminuye, y viceversa.

El sistema ideal tendría tanto de alta precisión y alta recuperación. Pero, siendo realistas, el mejor resultado es lograr un delicado equilibrio entre los dos. Haciendo hincapié en la precisión o recordar Realmente depende del problema que estamos tratando de resolver.




» » » » Conceptos básicos de filtros de análisis predictivo basados ​​en contenido