Cómo ensemble métodos para aumentar la precisión de predicción analítica

Al igual que en el mundo real, así que con la multiplicidad de modelos analíticos predictivos: Donde hay unidad, hay fuerza. Varios modelos pueden combinarse de diferentes maneras para hacer predicciones. A continuación, puede aplicar el modelo combinado - llamado modelo de conjunto - en la etapa de aprendizaje, en la etapa de clasificación, o en ambas etapas.

He aquí una manera de utilizar un modelo de conjunto:

Dividir los datos de entrenamiento en varias series.
Haga que cada uno de los modelos individuales que conforman las partes del proceso modelo de conjunto de los datos y aprender de ella.
Haga que cada modelo de producir sus resultados de aprendizaje de sus datos.

Hasta ahora, todo bien. Pero con el fin de obtener el modelo conjunto para predecir una etiqueta futura clase o categoría de nuevos datos y tomar una decisión, usted tiene que ejecutar los nuevos datos a través de toda la formación modelos- cada modelo predice una etiqueta de clase. Luego, sobre la base de la clasificación colectiva o predicción, puede generar una predicción general.

Puede generar esa predicción general simplemente la implementación de un mecanismo de votación que decide el resultado final. Una técnica de votación podría usar la etiqueta que la mayoría de los modelos predicen que la etiqueta que el modelo de conjunto produce como resultado.

Supongamos que usted quiere construir un modelo que predice si una dirección de correo entrante es spam. Supongamos que los datos de entrenamiento consiste en una serie de correos electrónicos en los cuales algunos son spam y otros no lo son. A continuación, puede distribuir ese conjunto de datos de una serie de modelos con fines de capacitación.

A continuación, los modelos entrenados procesan un correo electrónico entrante. Si la mayoría de los modelos de clasificarlo como spam, entonces el modelo de conjunto da la dirección de correo de la etiqueta final del spam.

Otra forma de implementar un modelo de conjunto es sopesar la precisión de cada modelo que estamos construyendo en el modelo de conjunto en contra de la exactitud de todos los demás modelos de la conjunto:

Se asigna un peso específico (precisión) para cada modelo.
Este peso variará de un conjunto de datos a otro y de un problema de negocio a la siguiente.
Después se forman los modelos, puede utilizar los datos de prueba donde se sabe que la clasificación de cada punto de datos en los datos de prueba.
Evaluar la predicción hecha por cada modelo para cada caso de prueba.
Aumenta el peso de los modelos que predicen correctamente y reducir el peso de los modelos que clasifican los datos de forma incorrecta.

Sobre el autor

Cómo construir desplegables modelos predictivos de análisis

La construcción de un modelo para el análisis predictivo no se traduce automáticamente en la implementación de ese modelo en producción. Un modelo puede predecir con éxito y precisión el siguiente resultado de negocio y todavía no sea…

¿Cómo crear una clasificación r análisis predictivo modelo

¿Quieres crear un modelo de análisis predictivo que pueda evaluar el uso de los resultados conocidos. Para hacer eso, dividir el semillas conjunto de datos en dos conjuntos: uno para entrenar el modelo y otra para probar el modelo. Una 70/30…

Cómo mantener predictivo análisis de datos al día

Después de la etapa de carga de extraer, transformar, cargar, después de obtener sus datos en esa base de datos separada, data mart, o almacén para el análisis, usted necesita para mantener los datos frescos por lo que los modeladores pueden…

Cómo cargar los datos en una clasificación r análisis predictivo modelo

El conjunto de datos se analizan para hacer una predicción sobre es el conjunto de datos Semillas, que se puede encontrar en la máquina de aprendizaje del repositorio UCI. Este conjunto de datos tiene 210 observaciones y 7 atributos, además de la…

Cómo nuevas predicciones analíticas con regresión r

Para hacer predicciones analíticas con nuevos datos, sólo tiene que utilizar la función con una lista de los siete valores de los atributos. El siguiente código hace ese trabajo:> NewPrediction lt; - predecir (modelo,
lista (cilindros =…

Cómo delinear las pruebas y datos de prueba para el análisis predictivo

Cuando los datos están listos y ya está a punto de comenzar la construcción de su modelo predictivo para el análisis, es útil para delinear su metodología de pruebas y elaborar un plan de pruebas. La prueba debe ser impulsada por los objetivos…

Cómo preparar los datos para un modelo de análisis predictivo

Cuando haya definido los objetivos del modelo de análisis predictivo, el siguiente paso es identificar y preparar los datos que va a utilizar para construir su modelo. La secuencia general de pasos es la siguiente:Identificar las fuentes de…

Cómo ejecutar los datos de prueba y evaluar un modelo de aprendizaje supervisado svm

Aprendizaje supervisado es una tarea de aprendizaje automático que aprende de los datos de análisis predictivo que ha sido etiquetados. Una manera de pensar sobre el aprendizaje supervisado es que el etiquetado de los datos se realiza bajo la…

Cómo ejecutar datos de entrenamiento en un modelo de aprendizaje supervisado svm

Antes de que pueda alimentar el clasificador Apoyo Vector Machine (SVM) con los datos que se cargan durante el análisis predictivo, debe dividir el conjunto de datos completo en un conjunto de entrenamiento y de prueba.Afortunadamente, scikit-learn…

Cómo probar el modelo de análisis predictivo

Para poner a prueba el modelo de análisis predictivo que construiste, es necesario dividir el conjunto de datos en dos conjuntos: formación y la prueba conjuntos de datos. Estos conjuntos de datos deben ser seleccionados al azar y deben ser una…

Cómo utilizar la analítica supervisadas para entrenar modelos predictivos

En análisis supervisadas, tanto de entrada como de salida preferidos son parte de los datos de entrenamiento. El modelo de análisis predictivo se presenta con los resultados correctos como parte de su proceso de aprendizaje. Tal aprendizaje…

La minería de datos para los datos de gran

La minería de datos consiste en explorar y analizar grandes cantidades de datos para encontrar las pautas de los grandes datos. Las técnicas salieron de los campos de la estadística y la inteligencia artificial (IA), con un poco de gestión de…

maniqui-es.com » Computadoras y software » Big Data » La ciencia de datos » Cómo ensemble métodos para aumentar la precisión de predicción analítica