Cómo cargar los datos en un modelo de análisis predictivo r clasificación

El conjunto de datos se analizan para hacer una predicción sobre el conjunto de datos es la semillas, que se pueden encontrar en la repositorio UCI de aprendizaje automático. Este conjunto de datos dispone de 210 observaciones y 7 atributos, además de la etiqueta. La etiqueta es el resultado esperado y se utiliza para entrenar y evaluar la precisión del modelo predictivo.

El resultado que usted está tratando de predecir es el tipo de semilla que es (atributo 8), teniendo en cuenta los valores de los siete atributos. Los tres valores posibles para el tipo de semilla están etiquetadas 1, 2, y 3, y representan la Kama, Rosa, y las variedades canadienses de trigo.

Los atributos en el orden de las columnas que se proporcionan:

zona
perímetro
compacidad
longitud del núcleo
Video: URJCx - MOOC Técnicas de análisis de datos y Big Data
anchura de kernel
coeficiente de asimetría
la longitud de la ranura del núcleo
clase de trigo

Para obtener el conjunto de datos del repositorio UCI y cargarlo en la memoria, escriba el siguiente comando en la consola:

gt; semillas lt; - 
read.csv ("http://archive.ics.uci.edu/ml/machine ellas el aprendizaje-bases de datos / 00236 / seeds_dataset.txt", Header = FALSE, sep =", As.is = TRUE)

Se ve que el conjunto de datos se carga en la memoria como la variable trama de datos semillas, al mirar en su panel de área de trabajo (la derecha superior). Haga clic en el semillas variable para ver los valores de datos en el panel principal (la parte superior izquierda). Así es como se ven los datos en el panel de origen.

Puede encontrar más información sobre los datos que acaba de cargar mediante el uso de la resumen() función.

gt; Resumen (semillas) V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu.:12.27 primera Qu.:13.45 primera Qu.:0.8569Median: 14,36 Mediana: La mediana de 14.32: 0.8734Mean: 14.85 Media: 14.56 Media: 0.87103rd Qu.:17.30 tercera Qu.:15.71 tercera Qu.:0.8878 Max. : 21.18 Max. : 17.25 Max. : 0.9183 ...

Video: URJCx - MOOC Técnicas de análisis de datos y Big Data