Cómo ejecutar datos de entrenamiento en un modelo de aprendizaje supervisado svm

Antes de que pueda alimentar el clasificador Apoyo Vector Machine (SVM) con los datos que se cargan durante el análisis predictivo, debe dividir el conjunto de datos completo en un conjunto de entrenamiento y de prueba.

Afortunadamente, scikit-learn ha implementado una función que le ayudará a dividir fácilmente el conjunto de datos completo. los train_test_split función toma como entrada un único conjunto de datos y un valor de porcentaje. El valor de porcentaje se utiliza para determinar el tamaño del conjunto de prueba. La función devuelve dos conjuntos de datos: los datos de prueba (con su tamaño especificado) y la formación de datos (que utiliza los datos restantes).

Por lo general, uno puede tomar alrededor de 70 a 80 por ciento de los datos para su uso como un conjunto de entrenamiento y el uso de los datos restantes como el conjunto de prueba. Pero el conjunto de datos Iris es muy pequeño (sólo 150 casos), para que pueda tomar el 90 por ciento de ella para entrenar el modelo y utilizar el otro 10 por ciento en los datos de prueba para ver cómo su modelo predictivo va a realizar.

Escriba el siguiente código para dividir el conjunto de datos:

>>> From sklearn cross_validation importación >>> X_train, X_test, y_train, y_test = cross_validation.train_test_split (iris.data, iris.target, test_size = 0,10, random_state = 111)

Las primeras líneas de las importaciones validación cruzada biblioteca en tu sesión. La segunda línea crea el equipo de prueba de 10 por ciento de la muestra.

x_train contendrá 135 observaciones y sus características.y_entrenar contendrá 135 etiquetas en el mismo orden que los 135 observaciones.x_test contendrá 15 (o 10 por ciento) observaciones y sus características.y_test contendrá 15 etiquetas en el mismo orden que las 15 observaciones.

El siguiente código comprueba que la división es lo que esperaba:

>>> X_train.shape (135, 4) >>> y_train.shape (135,) >>> X_test.shape (15, 4) >>> y_test.shape (15,)

Se puede ver desde la salida que hay 135 observaciones con 4 funciones y 135 etiquetas en el conjunto de entrenamiento. El equipo de prueba tiene 15 observaciones con 4 funciones y 15 etiquetas.

Muchos principiantes en el campo de la analítica predictiva olvide de dividir los conjuntos de datos - que introduce un defecto de diseño serio en el proyecto. Si los 150 casos completos fueron cargados en la máquina como datos de entrenamiento, eso dejaría sin datos invisibles para probar el modelo. Entonces usted tendría que recurrir a la reutilización de algunas de las instancias de formación para poner a prueba el modelo predictivo.

Vas a ver que en una situación así, el modelo siempre predice la clase correcta - porque usted está utilizando los mismos datos exacta que utilizó para entrenar el modelo. El modelo ya ha visto este patrón de antes- que no tendrá ningún problema simplemente repetir lo que ha visto. Un modelo predictivo de trabajo tiene que hacer predicciones para los datos que no se ha visto todavía.

Cuando usted tiene una instancia de un clasificador SVM, un conjunto de datos de entrenamiento, y un conjunto de datos de prueba, ya está listo para entrenar el modelo con los datos de entrenamiento. Al escribir el código siguiente en el intérprete hará exactamente eso:

>>> SvmClassifier.fit (X_train, y_train)

Esta línea de código crea un modelo de trabajo para hacer predicciones a partir. Específicamente, un modelo predictivo que predecir qué clase de Iris un nuevo conjunto de datos sin etiqueta pertenece. los svmClassifier instancia tendrá varios métodos que puede llamar para hacer varias cosas.

Por ejemplo, después de llamar al ajuste método, el método más útil para llamar es el predecir método. Eso es el método al que va a alimentar de datos nueva a cambio, predice el resultado.

Sobre el autor

Cómo crear un modelo de aprendizaje supervisado con regresión logística

Después de construir su primer modelo predictivo clasificación para el análisis de los datos, la creación de más modelos como que es una tarea muy sencilla en scikit. La única diferencia real de un modelo a otro es que puede que tenga que…

Cómo ensemble métodos para aumentar la precisión de predicción analítica

Al igual que en el mundo real, así que con la multiplicidad de modelos analíticos predictivos: Donde hay unidad, hay fuerza. Varios modelos pueden combinarse de diferentes maneras para hacer predicciones. A continuación, puede aplicar el modelo…

¿Cómo evaluar un modelo de aprendizaje no supervisado con k-medias

Después de que haya elegido su número de grupos de análisis predictivo y ha configurado el algoritmo para rellenar los racimos, usted tiene un modelo predictivo. Puedes hacer predicciones en base a nuevos datos entrantes llamando al predecir…

Cómo introducir los datos de la r de regresión para el análisis predictivo

El conjunto de datos que va a utilizar en este ejemplo es el conjunto de datos Auto-MPG, que se puede encontrar en el repositorio UCI. Este conjunto de datos tiene 398 observaciones y 8 atributos además de la etiqueta.los etiqueta se la esperaba la…

Cómo cargar datos en un modelo de aprendizaje supervisado svm

Para el análisis predictivo, es necesario cargar los datos para sus algoritmos a utilizar. Cargando el conjunto de datos Iris en scikit es tan simple como la emisión de un par de líneas de código, porque scikit ya ha creado una función para…

Cómo cargar los datos en una clasificación r análisis predictivo modelo

El conjunto de datos se analizan para hacer una predicción sobre es el conjunto de datos Semillas, que se puede encontrar en la máquina de aprendizaje del repositorio UCI. Este conjunto de datos tiene 210 observaciones y 7 atributos, además de la…

Cómo nuevas predicciones analíticas con regresión r

Para hacer predicciones analíticas con nuevos datos, sólo tiene que utilizar la función con una lista de los siete valores de los atributos. El siguiente código hace ese trabajo:> NewPrediction lt; - predecir (modelo,
lista (cilindros =…

Cómo delinear las pruebas y datos de prueba para el análisis predictivo

Cuando los datos están listos y ya está a punto de comenzar la construcción de su modelo predictivo para el análisis, es útil para delinear su metodología de pruebas y elaborar un plan de pruebas. La prueba debe ser impulsada por los objetivos…

Cómo ejecutar los datos de prueba y evaluar un modelo de aprendizaje supervisado svm

Aprendizaje supervisado es una tarea de aprendizaje automático que aprende de los datos de análisis predictivo que ha sido etiquetados. Una manera de pensar sobre el aprendizaje supervisado es que el etiquetado de los datos se realiza bajo la…

Cómo probar el modelo de análisis predictivo

Para poner a prueba el modelo de análisis predictivo que construiste, es necesario dividir el conjunto de datos en dos conjuntos: formación y la prueba conjuntos de datos. Estos conjuntos de datos deben ser seleccionados al azar y deben ser una…

Cómo utilizar la analítica supervisadas para entrenar modelos predictivos

En análisis supervisadas, tanto de entrada como de salida preferidos son parte de los datos de entrenamiento. El modelo de análisis predictivo se presenta con los resultados correctos como parte de su proceso de aprendizaje. Tal aprendizaje…

Cómo visualizar el clasificador en un SVM aprendizaje supervisado modelo

El conjunto de datos del iris no es fácil representar gráficamente para el análisis predictivo en su forma original porque no se puede trazar las cuatro coordenadas (de las características) del conjunto de datos en una pantalla bidimensional.…

maniqui-es.com » Computadoras y software » Big Data » La ciencia de datos » Cómo ejecutar datos de entrenamiento en un modelo de aprendizaje supervisado svm