Cómo ensemble métodos para aumentar la precisión de predicción analítica
Al igual que en el mundo real, así que con la multiplicidad de modelos analíticos predictivos: Donde hay unidad, hay fuerza. Varios modelos pueden combinarse de diferentes maneras para hacer predicciones. A continuación, puede aplicar el modelo combinado - llamado modelo de conjunto - en la etapa de aprendizaje, en la etapa de clasificación, o en ambas etapas.
He aquí una manera de utilizar un modelo de conjunto:
Dividir los datos de entrenamiento en varias series.
Haga que cada uno de los modelos individuales que conforman las partes del proceso modelo de conjunto de los datos y aprender de ella.
Haga que cada modelo de producir sus resultados de aprendizaje de sus datos.
Hasta ahora, todo bien. Pero con el fin de obtener el modelo conjunto para predecir una etiqueta futura clase o categoría de nuevos datos y tomar una decisión, usted tiene que ejecutar los nuevos datos a través de toda la formación modelos- cada modelo predice una etiqueta de clase. Luego, sobre la base de la clasificación colectiva o predicción, puede generar una predicción general.
Puede generar esa predicción general simplemente la implementación de un mecanismo de votación que decide el resultado final. Una técnica de votación podría usar la etiqueta que la mayoría de los modelos predicen que la etiqueta que el modelo de conjunto produce como resultado.
Supongamos que usted quiere construir un modelo que predice si una dirección de correo entrante es spam. Supongamos que los datos de entrenamiento consiste en una serie de correos electrónicos en los cuales algunos son spam y otros no lo son. A continuación, puede distribuir ese conjunto de datos de una serie de modelos con fines de capacitación.
A continuación, los modelos entrenados procesan un correo electrónico entrante. Si la mayoría de los modelos de clasificarlo como spam, entonces el modelo de conjunto da la dirección de correo de la etiqueta final del spam.
Otra forma de implementar un modelo de conjunto es sopesar la precisión de cada modelo que estamos construyendo en el modelo de conjunto en contra de la exactitud de todos los demás modelos de la conjunto:
Se asigna un peso específico (precisión) para cada modelo.
Este peso variará de un conjunto de datos a otro y de un problema de negocio a la siguiente.
Después se forman los modelos, puede utilizar los datos de prueba donde se sabe que la clasificación de cada punto de datos en los datos de prueba.
Evaluar la predicción hecha por cada modelo para cada caso de prueba.
Aumenta el peso de los modelos que predicen correctamente y reducir el peso de los modelos que clasifican los datos de forma incorrecta.