¿Cómo elegir un algoritmo para un modelo de análisis predictivo
Varios algoritmos estadísticos, de minería de datos, y la máquina de aprendizaje están disponibles para su uso en el modelo de análisis predictivo. Usted está en una mejor posición para seleccionar un algoritmo después de que haya definido los objetivos de su modelo y ha seleccionado los datos que vamos a trabajar en.
Algunos de estos algoritmos fueron desarrollados para resolver problemas específicos del negocio, mejorar los algoritmos existentes, o proporcionar nuevas capacidades - que puede hacer que algunos de ellos más apropiado para sus propósitos que otros. Usted puede elegir entre una variedad de algoritmos para abordar las preocupaciones de negocios, tales como las siguientes:
Para la segmentación de clientes y / o detección de la comunidad en el ámbito social, por ejemplo, que había necesidad de algoritmos de agrupamiento.
Para la retención de clientes o para desarrollar un sistema de recomendación, tendrá que utilizar algoritmos de clasificación.
Para la puntuación de crédito o la predicción de la siguiente resultado de los eventos controlados por tiempo, tendrá que utilizar un algoritmo de regresión.
Como permitan el tiempo y los recursos, se debe ejecutar el mayor número de algoritmos del tipo apropiado como puedas. La comparación de diferentes carreras de diferentes algoritmos puede traer sorprendentes descubrimientos acerca de los datos o de la inteligencia de negocio integrado en los datos. Si lo hace, le da una visión más detallada en el problema de la empresa, y le ayuda a identificar qué variables dentro de sus datos tiene poder predictivo.
Algunos proyectos de análisis predictivo logran mejor mediante la construcción de un modelo de conjunto, un grupo de modelos que operan en los mismos datos. Un modelo de conjunto utiliza un mecanismo predefinido para recopilar los resultados de todos sus modelos de componentes y proporcionar un resultado final para el usuario.
Los modelos pueden adoptar diversas formas - una consulta, una colección de escenarios, un árbol de decisión, o un análisis matemático avanzado. Además, ciertos modelos funcionan mejor para ciertos datos y análisis. (Por ejemplo) Se puede utilizar algoritmos de clasificación que emplean reglas de decisión para decidir el resultado de un escenario o una transacción dada, abordar preguntas como éstas:
Es probable que respondan a nuestra campaña de marketing a este cliente?
Es probable que sea parte de un esquema de lavado de dinero este dinero de transferencia?
Es probable que por defecto en el préstamo este solicitante de préstamo?
Usted puede utilizar algoritmos de agrupamiento no supervisado para encontrar qué relaciones existen dentro de su conjunto de datos. Puede utilizar estos algoritmos para encontrar diferentes agrupaciones entre sus clientes, determinar qué servicios se pueden agrupar, o decidir por ejemplo que los productos se pueden upsold.
Algoritmos de regresión pueden ser utilizados para predecir los datos continuos, como la predicción de la tendencia de un movimiento social dados sus precios anteriores.
Datos objetivos y comerciales que no son los únicos factores a considerar cuando usted está seleccionando un algoritmo. La experiencia de los científicos de datos es de gran valor en este punto- recoger un algoritmo que va a hacer el trabajo es a menudo una combinación difícil de la ciencia y el arte.
La parte técnica proviene de la experiencia y la competencia en el ámbito empresarial, que también desempeña un papel fundamental en la identificación de un modelo que puede servir a los objetivos de negocio con precisión.