Basarse en los diagramas de dispersión básicos

Los analistas de datos a menudo se aprovechan de características especiales para incluir más información en gráficos simples. Etiquetas, superposiciones y selección interactiva son características de las aplicaciones de minería de datos, características especiales que le permiten ser más productivo.

Kilometraje disminuye a medida que aumenta la potencia, como se ve en la figura siguiente.

Video: Diagrama de Dispersion

Kilometraje aumenta con el tiempo, como se puede ver, un diagrama de dispersión de kilometraje en comparación con el año del modelo. Sería de gran ayuda para conseguir estas dos ideas en un mismo gráfico.

Minería de datos común se acerca para la integración de más de dos variables en una gráfica incluyen

  • Etiquetas: Las etiquetas son valores de una cadena o una variable categórica que se han superpuesto en el diagrama de dispersión. La siguiente figura muestra un diagrama de dispersión etiquetado con el año del modelo del vehículo.

    Conjuntos de datos con muchos puntos o etiquetas largas pueden hacer que estas cartas ilegibles, sin embargo! La solución es utilizar sólo una muestra de los datos. Configuración para este tipo de muestreo se muestra en la siguiente figura.

  • superposiciones: Con superposiciones, los valores de una variable categórica definen la forma o el color de los puntos. La siguiente figura muestra la configuración de un diagrama de dispersión para superponer el año del modelo en el diagrama de dispersión kilometraje-contra-caballos de fuerza.

    El diagrama de dispersión de superposición exportado aparece en la imagen siguiente. Puede ser más fácil de leer superposiciones de color que superposiciones de punto de forma. La instalación es por lo general de la misma.

Otra cosa a tener en cuenta con los diagramas de dispersión: Es posible que tenga varios puntos que caen en el mismo lugar! Si es así, puede que no sea capaz de decir un punto en un caso desde un punto de 100 casos. El remedio es para comprobar si hay una opción para hacer varias instancias visibles. Busque tamaño de punto o estar nervioso (se mueve puntos ligeramente fuera de sus verdaderos lugares para hacer que todos ellos visibles) Opciones.

diagramas de dispersión interactivos son grandes ahorradores de tiempo para la minería de datos.

Digamos que se ve un grupo interesante de los casos en un gráfico, y desea investigar más a fondo sólo esos casos. Si usted está buscando en sólo uno o dos puntos, es posible obtener la información que desee, con solo pasar, pero eso no es satisfactoria cuando usted está interesado en más de un par de puntos.

herramientas de selección de datos en los diagramas de dispersión interactivas le dan más poder para seleccionar datos. La siguiente figura muestra la misma configuración gráfica, pero con un grupo de puntos seleccionado haciendo clic y arrastrando el ratón alrededor de ellos. Esto no es sólo una función visual.

Video: Diagrama de dispersión o nube de puntos

Puede exportar los puntos seleccionados como un nuevo conjunto de datos. Esto es muy práctico y rápido!

Video: Diagramas de Dispersion en analisis de Correlacion Lineal

Si los puntos que necesita no encajan muy bien en una selección rectangular, tiene otras opciones. Consulte el área de zoom / Seleccionar. Se puede ver un botón con un rectángulo de selección rectangular y otra con una forma redondeada para la selección de forma libre.

He aquí un ejemplo de selección de forma libre a partir de datos sobre el contenido de nicotina de los cigarrillos vendidos en diferentes partes del mundo. Este diagrama de dispersión muestra la nicotina por cigarrillo para las muestras de las seis regiones de las Naciones Unidas. (Este es un uso no tradicional de un diagrama de dispersión, debido región no es una variable continua es categórica. Los analistas de datos suelen utilizar herramientas tradicionales en formas no tradicionales).

Los puntos dentro de una región no caen en una línea vertical perfecta. Pequeños cambios (jitter) a la izquierda y la derecha están hechas para facilitar la lectura y la apariencia única. Unos pocos cigarrillos tienen niveles excepcionalmente altos de nicotina, y que desea seleccionar aquellos casos.

Un menú desplegable ofrece opciones de selección. de selección poligonal le permite marcar una zona de forma libre en el diagrama de dispersión.

Para marcar, haga clic en el gráfico para hacer un punto de partida y, a continuación, en una y otra vez alrededor del grupo de puntos que quiere hasta que haya realizado la forma que necesita.

Video: Diagrama de Dispersion FINAL

A la derecha, clic indica que ha completado la selección- esto es visible desde el más destacado en el gráfico.

Artículos Relacionados