Cómo relacionar una variable a otra con los diagramas de dispersión

El primer paso hacia el modelo predictivo se relacionen variables entre sí. Un notable herramienta sencilla, para que sea el diagrama de dispersión. Se utiliza para relacionar una medida continua a otra. Los analistas de datos a veces se extienden las reglas y lo utilizan con variables categóricas también.

La horizontal (x) Eje de la trama representa valores de una variable del eje vertical (y) Representa una segunda variable. Puede que no tenga un sentido de qué variable es independiente y que depende de cada par de variables.

Si lo hace, la variable independiente debe estar en el eje horizontal. Cada punto de la gráfica representa las coordenadas, el par de valores para las dos variables dentro de un solo caso. (Estos pares se denominan a veces pares XY).

Video: Cómo hacer una correlación y un diagrama de dispersión usando SPSS

Encuentra su herramienta de dispersión y establecer una herramienta básica de dispersión mediante la selección de dos variables a utilizar. La siguiente figura muestra esta herramienta en el menú de Orange- la ubicación de la herramienta varía según el producto.

Video: Diagrama de dispersión y recta de regresión en SPSS v.20

El ejemplo en la siguiente imagen muestra una pantalla- interactiva el diagrama de dispersión aparece inmediatamente. En otra herramienta, es posible que necesite medidas adicionales para ejecutar y crear el gráfico.

El ejemplo diagrama de dispersión se refiere el kilometraje de auto para la potencia del motor. Low caballos de fuerza está asociado con un alto kilometraje, y cuanto mayor es la potencia, menor es el kilometraje. Se puede ver fácilmente este patrón en los datos. Usted puede notar una forma, no lineal, sino algo curvada. Esto podría proporcionar pistas acerca de lo que los tipos de modelo a intentarlo más tarde.

aplicaciones de minería de datos a menudo tienen algunas características interactivas en pantallas gráficas. Por ejemplo, la siguiente figura muestra que situando el puntero del ratón sobre un punto revela los valores exactos de las dos variables para ese punto. Esto es más fácil de tratar de leer los valores de los ejes!

Artículos Relacionados