Cómo cargar datos en un modelo de aprendizaje supervisado svm
Video: Aprendizaje de Maquinas
Para el análisis predictivo, es necesario cargar los datos para sus algoritmos a utilizar. Cargando el conjunto de datos del iris de scikit es tan simple como la emisión de un par de líneas de código, porque scikit ya ha creado una función para cargar el conjunto de datos.
sépalo Longitud | sépalo Ancho | Longitud pétalo | pétalo Ancho | Clase de destino / de la etiqueta |
---|---|---|---|---|
5.1 | 3.5 | 1.4 | 0.2 | Setosa (0) |
7.0 | 3.2 | 4.7 | 1.4 | Versicolor (1) |
6.3 | 3.3 | 6.0 | 2.5 | Virginica (2) |
Abrir una nueva sesión intérprete interactivo de Python.
Utilice una nueva sesión de Python así que no hay nada que queda en la memoria y tiene una pizarra limpia para trabajar.
Introduzca el código siguiente en el indicador y observar la salida:
gt; gt; gt; de sklearn.datasets importar load_irisgt; gt; gt; iris = load_iris ()
Después de ejecutar estas dos afirmaciones, no se debe ver ninguna mensajes del intérprete. La variable iris debe contener todos los datos de la iris.csv archivo.
Antes de crear un modelo predictivo, es importante entender un poco acerca de la nueva variable iris y lo que puede hacer con él. Esto hace que el código sea más fácil de seguir y el proceso mucho más simple de entender. Puede inspeccionar el valor de iris escribiéndola en el intérprete.
gt; gt; gt; iris
La salida será todo el contenido de la iris.csv archivo, junto con alguna otra información sobre el conjunto de datos que el load_iris función de carga en la variable. La variable es una estructura de datos del diccionario con cuatro propiedades principales. Las propiedades importantes de iris Se enumeran a continuación.
Video: Hello World - Machine Learning Recipes #1
Nombre de la propiedad | Descripción |
---|---|
datos | Contiene todas las medidas de las observaciones. |
feature_name | Contiene el nombre de la función (nombre del atributo). |
objetivo | Contiene todos los objetivos (etiquetas) de las observaciones. |
target_names | Contiene los nombres de las clases. |
Puede imprimir los valores en el intérprete escribiendo el nombre de la variable seguido de punto seguido del nombre de la propiedad. Un ejemplo es utilizar iris.data para acceder a la propiedad de iris, Me gusta esto:
gt; gt; gt; iris.data
Esta es una forma estándar de acceder a las propiedades de un objeto en muchos lenguajes de programación.
Para crear una instancia del clasificador SVM, escriba el código siguiente en el intérprete:
gt; gt; gt; de LinearSVCgt importación sklearn.svm; gt; gt; svmClassifier = LinearSVC (random_state = 111)
La primera línea de código importa la SVC lineal biblioteca en la sesión. El lineal de vectores de soporte clasificador (SVC) es una implementación de SVM para la clasificación lineal y tiene soporte multi-clase. El conjunto de datos es algo linealmente separables y tiene tres clases, por lo que sería una buena idea experimentar conSVC lineal para ver cómo se realiza.
La segunda línea crea la instancia utilizando la variable svmClassifier. Esta es una variable importante a recordar. los aleatorio_estado parámetro le permite reproducir estos ejemplos y obtener los mismos resultados. Si usted no puso en el aleatorio_estado los parámetros, los resultados pueden diferir de los mostrados aquí.