Cómo cargar los datos en un modelo de análisis predictivo r clasificación

El conjunto de datos se analizan para hacer una predicción sobre el conjunto de datos es la semillas, que se pueden encontrar en la repositorio UCI de aprendizaje automático. Este conjunto de datos dispone de 210 observaciones y 7 atributos, además de la etiqueta. La etiqueta es el resultado esperado y se utiliza para entrenar y evaluar la precisión del modelo predictivo.

El resultado que usted está tratando de predecir es el tipo de semilla que es (atributo 8), teniendo en cuenta los valores de los siete atributos. Los tres valores posibles para el tipo de semilla están etiquetadas 1, 2, y 3, y representan la Kama, Rosa, y las variedades canadienses de trigo.

Los atributos en el orden de las columnas que se proporcionan:

  1. zona

  2. perímetro

  3. compacidad

  4. longitud del núcleo

    Video: URJCx - MOOC Técnicas de análisis de datos y Big Data

  5. anchura de kernel

  6. coeficiente de asimetría

  7. la longitud de la ranura del núcleo

  8. clase de trigo

Para obtener el conjunto de datos del repositorio UCI y cargarlo en la memoria, escriba el siguiente comando en la consola:

gt; semillas lt; - 
read.csv ("http://archive.ics.uci.edu/ml/machine ellas el aprendizaje-bases de datos / 00236 / seeds_dataset.txt", Header = FALSE, sep =", As.is = TRUE)

Se ve que el conjunto de datos se carga en la memoria como la variable trama de datos semillas, al mirar en su panel de área de trabajo (la derecha superior). Haga clic en el semillas variable para ver los valores de datos en el panel principal (la parte superior izquierda). Así es como se ven los datos en el panel de origen.

Puede encontrar más información sobre los datos que acaba de cargar mediante el uso de la resumen() función.

gt; Resumen (semillas) V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu.:12.27 primera Qu.:13.45 primera Qu.:0.8569Median: 14,36 Mediana: La mediana de 14.32: 0.8734Mean: 14.85 Media: 14.56 Media: 0.87103rd Qu.:17.30 tercera Qu.:15.71 tercera Qu.:0.8878 Max. : 21.18 Max. : 17.25 Max. : 0.9183 ...
Artículos Relacionados