Cómo predecir nuevos valores de datos con r

Además de describir las relaciones, los modelos también se pueden utilizar para predecir los valores para los nuevos datos. Para ello, muchos sistemas modelo en R utilizan la misma función, convenientemente llama predecir(). Cada paradigma de modelado en I tiene una función de predecir con su propio sabor, pero en general la funcionalidad básica es la misma para todos ellos.

Cómo obtener los valores de los datos

Por ejemplo, un fabricante de automóviles tiene tres diseños para un coche nuevo y quiere saber lo que el kilometraje pronosticada se basa en el peso de cada nuevo diseño. Con el fin de hacer esto, primero debe crear una trama de datos con los nuevos valores - por ejemplo, así:

gt; Carros nuevos lt; - data.frame (wt = c (1.7, 2.4, 3.6))

Siempre asegúrese de que los nombres de las variables que utiliza son los mismos utilizados en el modelo. Cuando se hace esto, sólo tiene que llamar al predecir() funcionar con los argumentos adecuados, como este:

Video: Episodio 340 - Normalizacion de datos

gt; predecir (Modelo, NewData = new.cars) 12.328,19952 24.45839 18.04503

Por lo tanto, el coche más ligero tiene un kilometraje previsto de 28,2 millas por galón y el coche más pesado tiene un kilometraje previsto de 18 millas por galón, de acuerdo con este modelo. Por supuesto, si se utiliza un modelo inadecuado, sus predicciones pueden ser más o menos fuera así.

La confianza en sus predicciones

Con el fin de tener una idea acerca de la exactitud de las predicciones, puede solicitar intervalos alrededor de su predicción. Para obtener una matriz con la predicción y un intervalo de confianza del 95 por ciento en torno a la predicción media, establece el argumento intervalo a `confianza` Me gusta esto:

Video: Predicción con Redes Neuronales

gt; predecir (Modelo, NewData = new.cars, intervalo = `confianza`) lwr ajuste UPR1 30.251502 24.45839 26.14755 28.19952 23.01617 25.900623 18.04503 16.86172 19.22834

Ahora usted sabe que - de acuerdo a su modelo - un coche con un peso de 2,4 toneladas tiene, de media, un kilometraje entre 23 y 25,9 millas por galón. De la misma manera, se puede pedir un intervalo de predicción del 95 por ciento en configurar el intervalo argumento para `predicción`:

gt; predecir (Modelo, NewData = new.cars, intervalo = `predicción`) LWR ajuste UPR1 21,64930 28,19952 34,749752 24,45839 18,07287 30,843923 18,04503 11,71296 24,37710

Esta información le indica que el 95 por ciento de los coches con un peso de 2,4 toneladas tiene un kilometraje en algún lugar entre 18,1 y 30,8 millas por galón - suponiendo que su modelo es correcto, por supuesto.

Si prefiere construir su propio intervalo de confianza, puede obtener los errores estándar en sus predicciones, así estableciendo el argumento se.fit a CIERTO. No te dan un vector o una matriz-lugar, se obtiene una lista con un elemento ajuste que contiene las predicciones y un elemento se.fit que contiene los errores estándar.

Artículos Relacionados