Cómo predecir nuevos valores de datos con r
Aparte de la descripción de las relaciones, los modelos también pueden usarse para predecir los valores para los nuevos datos. Por eso, muchos sistemas modelo en I utilizan la misma función, convenientemente llamado predecir ()
. Cada modelado de paradigma en R tiene una función de predecir con su propio sabor, pero en general la funcionalidad básica es la misma para todos ellos.Cómo obtener los valores de los datos
Por ejemplo, un fabricante de automóviles tiene tres diseños para un coche nuevo y quiere saber lo que el kilometraje previsto se basa en el peso de cada nuevo diseño. Con el fin de hacer esto, primero debe crear un marco de datos con los nuevos valores - por ejemplo, así:
> New.cars lt; - data.frame (p = c (1.7, 2.4, 3.6))
Asegúrese siempre de que los nombres de las variables que utiliza son los mismos utilizados en el modelo. Cuando haces eso, sólo tiene que llamar al predecir () funcionar con los argumentos adecuados, como este:
> Predecir (Modelo, newdata = new.cars) 12.328,19952 24.45839 18.04503
Por lo tanto, el coche más ligero tiene un kilometraje predicho de 28,2 millas por galón y el coche más pesado tiene un kilometraje predicho de 18 millas por galón, de acuerdo con este modelo. Por supuesto, si se utiliza un modelo inadecuado, sus predicciones pueden ser más o menos fuera así.
La confianza en sus predicciones
Para tener una idea acerca de la exactitud de las predicciones, puede solicitar intervalos de alrededor de su predicción. Para obtener una matriz con la predicción y un intervalo de confianza del 95 por ciento en torno a la predicción media, establece el argumento intervalo a 'confianza' Me gusta esto:
> Predecir (Modelo, newdata = new.cars, intervalo = 'confianza') en forma LWR UPR1 28.19952 26.14755 24.45839 23.01617 30.251502 25.900623 18.04503 16.86172 19.22834
Ahora usted sabe que - de acuerdo a su modelo - un coche con un peso de 2,4 toneladas tiene, de media, un kilometraje entre 23 y 25.9 millas por galón. De la misma manera, usted puede pedir un intervalo de predicción del 95 por ciento al establecer el intervalo de argumento 'predicción':
> Predecir (Modelo, newdata = new.cars, intervalo = 'predicción') en forma LWR UPR1 28.19952 21.64930 24.45839 18.07287 34.749752 30.843923 18.04503 11.71296 24.37710
Esta información le indica que el 95 por ciento de los coches con un peso de 2,4 toneladas tienen un kilometraje en alguna parte entre 18.1 y 30.8 millas por galón - asumiendo que su modelo es correcto, por supuesto.
Si prefiere construir su propio intervalo de confianza, puede obtener los errores estándar en sus predicciones, así estableciendo el argumento se.fit a CIERTO. Usted no consigue un vector o una matriz-lugar, se obtiene una lista con un elemento ajuste que contiene las predicciones y un elemento se.fit que contiene los errores estándar.