Conceptos básicos de los modelos de clasificación de las predicciones analíticas

Una vez que tenga todas las herramientas y los datos necesarios para empezar a crear un modelo predictivo, comienza la diversión. En general, la creación de un modelo de aprendizaje para las tareas de clasificación que implicará los siguientes pasos:

Cargue los datos.
Elige un clasificador.
Capacitar al modelo.
Visualice el modelo.
Pon a prueba el modelo.
Evaluar el modelo.

Tanto la regresión logística y Apoyo Vector Machine (SVM) modelos de clasificación realizan bastante bien utilizando el conjunto de datos del iris.

Sépalo Longitud	Sépalo Ancho	Pétalo Longitud	Pétalo Ancho	Clase Objetivo / Label
5.1	3.5	1.4	0.2	Setosa (0)
7.0	3.2	4.7	1.4	Versicolor (1)
6.3	3.3	6.0	2.5	Virginica (2)

El modelo de regresión logística con el parámetro C = 1 era perfecto en sus predicciones, mientras que el modelo SVM y el modelo de regresión logística con C = 150 perdió un solo predicción. De hecho, la alta precisión de ambos modelos es el resultado de tener un pequeño conjunto de datos que tiene puntos de datos que están bastante cerca linealmente separables.

Curiosamente, el modelo de regresión logística con C = 150 tenía una parcela de superficie decisión más guapo que el de C = 1, pero no un mejor desempeño. Eso no es una cosa muy importante, teniendo en cuenta que el equipo de prueba es tan pequeño. Si se hubiera seleccionado otra división aleatorio entre conjunto de entrenamiento y equipo de prueba, los resultados podrían haber sido fácilmente diferente.

Esto revela otra fuente de complejidad que surge en la evaluación del modelo: el efecto del muestreo, y cómo elegir la formación y las pruebas conjuntos pueden afectar la producción del modelo. Técnicas de validación cruzada pueden ayudar a minimizar el impacto de un muestreo aleatorio en el rendimiento del modelo.

Para un mayor conjunto de datos con los datos de forma no lineal separables, se puede esperar que los resultados se desvían aún más. Además, la elección del modelo apropiado se convierte en cada vez más difícil debido a la complejidad y el tamaño de los datos. Esté preparado para gastar una gran cantidad de tiempo afinar sus parámetros para conseguir un ajuste ideal.

Al crear modelos predictivos, probar algunos algoritmos y exhaustivamente ajustar sus parámetros hasta encontrar lo que funciona mejor para sus datos. Luego compare sus resultados contra otros.

Sobre el autor

Cómo crear un modelo de aprendizaje supervisado con regresión logística

Después de construir su primer modelo predictivo clasificación para el análisis de los datos, la creación de más modelos como que es una tarea muy sencilla en scikit. La única diferencia real de un modelo a otro es que puede que tenga que…

Cómo ensemble métodos para aumentar la precisión de predicción analítica

Al igual que en el mundo real, así que con la multiplicidad de modelos analíticos predictivos: Donde hay unidad, hay fuerza. Varios modelos pueden combinarse de diferentes maneras para hacer predicciones. A continuación, puede aplicar el modelo…

Cómo nuevas predicciones analíticas con regresión r

Para hacer predicciones analíticas con nuevos datos, sólo tiene que utilizar la función con una lista de los siete valores de los atributos. El siguiente código hace ese trabajo:> NewPrediction lt; - predecir (modelo,
lista (cilindros =…

Cómo delinear las pruebas y datos de prueba para el análisis predictivo

Cuando los datos están listos y ya está a punto de comenzar la construcción de su modelo predictivo para el análisis, es útil para delinear su metodología de pruebas y elaborar un plan de pruebas. La prueba debe ser impulsada por los objetivos…

Cómo preparar los datos para un modelo de análisis predictivo

Cuando haya definido los objetivos del modelo de análisis predictivo, el siguiente paso es identificar y preparar los datos que va a utilizar para construir su modelo. La secuencia general de pasos es la siguiente:Identificar las fuentes de…

Cómo ejecutar los datos de prueba y evaluar un modelo de aprendizaje supervisado svm

Aprendizaje supervisado es una tarea de aprendizaje automático que aprende de los datos de análisis predictivo que ha sido etiquetados. Una manera de pensar sobre el aprendizaje supervisado es que el etiquetado de los datos se realiza bajo la…

Cómo ejecutar datos de entrenamiento en un modelo de aprendizaje supervisado svm

Antes de que pueda alimentar el clasificador Apoyo Vector Machine (SVM) con los datos que se cargan durante el análisis predictivo, debe dividir el conjunto de datos completo en un conjunto de entrenamiento y de prueba.Afortunadamente, scikit-learn…

Cómo anotar sus predicciones analíticas precisión

Al analizar la calidad de un modelo predictivo, usted querrá medir su precisión. El un pronóstico más preciso el modelo hace, más útil que es para la empresa, que es una indicación de su calidad. Todo esto es bueno - a excepción de cuando el…

Cómo probar el modelo de análisis predictivo

Para poner a prueba el modelo de análisis predictivo que construiste, es necesario dividir el conjunto de datos en dos conjuntos: formación y la prueba conjuntos de datos. Estos conjuntos de datos deben ser seleccionados al azar y deben ser una…

Cómo utilizar la analítica supervisadas para entrenar modelos predictivos

En análisis supervisadas, tanto de entrada como de salida preferidos son parte de los datos de entrenamiento. El modelo de análisis predictivo se presenta con los resultados correctos como parte de su proceso de aprendizaje. Tal aprendizaje…

Cómo utilizar regresiones lineales en el análisis predictivo

Regresión lineal es un método estadístico que analiza y descubre relaciones entre dos variables. En el análisis predictivo puede ser utilizado para predecir un valor numérico futuro de una variable.Considere un ejemplo de datos que contiene dos…

Modelos de regresión en la TI-84 Plus

Modelos de regresión es el proceso de encontrar una función que se aproxima a la relación entre las dos variables en dos listas de datos. La tabla muestra los tipos de modelos de regresión Plus calculadora TI-84 puede calcular.Tipos de Modelos…

maniqui-es.com » Computadoras y software » Big Data » La ciencia de datos » Conceptos básicos de los modelos de clasificación de las predicciones analíticas