Diagramas de dispersión: técnica gráfica de los datos estadísticos

A diferencia de un diagrama de tallo y hojas, una gráfico de dispersión está destinado a mostrar la relación entre dos variables. Puede ser difícil de ver si hay una relación entre dos variables con sólo mirar los datos en bruto, pero con un gráfico de dispersión, los patrones que existen en los datos a ser mucho más fáciles de ver.

Un diagrama de dispersión consiste en una serie de puntos- cada punto de muestra un único valor para dos variables diferentes. Por ejemplo, se puede construir un diagrama de dispersión para mostrar la relación entre los ingresos anuales de una empresa y sus beneficios anuales. Si usted está tratando de predecir las ganancias en base a los ingresos, el eje X se utiliza para mostrar los ingresos anuales, y el eje Y se utiliza para mostrar los beneficios anuales. Por lo tanto, los ingresos son considerados como la variable independiente, y las ganancias son considerados como la variable dependiente en esta relación.

En un gráfico de dispersión, el eje X (es decir, el eje horizontal) se utiliza para mostrar la independiente variable y el eje Y (el eje vertical) se utiliza para mostrar la dependiente variable.

En este ejemplo, cada punto de la gráfica de dispersión muestra los ingresos y las ventas para un año específico. La tabla muestra la relación entre los ingresos anuales y los beneficios anuales de una corporación durante los años 2004-2014.

Ingresos anuales y beneficios 2004-2014
AñoIngresos (millones de $)Ganancias ($ millones)
200422542
200523743
200624548
200722240
200826560
200927056
201025453
201128060
201229062
2013305sesenta y cinco
201431271

La siguiente figura muestra el gráfico de dispersión resultante.

Diagrama de dispersión de los ingresos y las ganancias anuales 2004-2014.
Diagrama de dispersión de los ingresos y las ganancias anuales 2004-2014.

Cada punto de la gráfica de dispersión representa los ingresos y beneficios relacionados de la empresa para un solo año. Por ejemplo, el punto en el superior derecho; esquina de la trama representa los datos de 2014, cuando los ingresos de la corporación fueron de $ 312 millones y las ganancias fueron de $ 71 millones.

Puede utilizar un gráfico de dispersión para determinar si

Video: Tablas de frecuencias y gráfica de puntos

  • Las dos variables tienden a moverse en la misma dirección.

  • Las dos variables tienden a moverse en direcciones opuestas.

  • Las dos variables no están relacionadas entre sí.

Si dos variables tienden a moverse en la misma dirección, que se dice que son relacionado positivamente- si tienden a moverse en direcciones opuestas, que se dice que son negativamente correlacionado. Si dos variables no muestran ningún patrón particular, que se dice que son correlacionadas.

Esta figura muestra un gráfico de dispersión de dos variables (X e Y) que están correlacionados positivamente.

gráfico de dispersión de dos variables correlacionadas positivamente.
gráfico de dispersión de dos variables correlacionadas positivamente.

El gráfico de dispersión muestra que a medida que aumenta X, hay una fuerte tendencia para Y para aumentar (pero no necesariamente en la misma cantidad). Esto muestra que X e Y se correlacionan positivamente.

La siguiente figura muestra el mismo gráfico de dispersión con una tendencia línea- la ecuación de esta línea se estima con análisis de regresión.

gráfico de dispersión de dos variables correlacionadas positivamente con una línea de tendencia.
gráfico de dispersión de dos variables correlacionadas positivamente con una línea de tendencia.

La línea de tendencia muestra la cantidad de cambios de Y en promedio, debido a un cambio específico en X. Una línea de tendencia de pendiente positiva indica que dos variables están positivamente correlated- Del mismo modo, una línea de tendencia con pendiente negativa indica que dos variables están correlacionadas negativamente. Si una línea de tendencia es plano (es decir, tiene una pendiente cero), esto indica que las dos variables no están relacionadas entre sí. La línea de tendencia de pendiente positiva muestra que X e Y se correlacionan positivamente.

La siguiente figura muestra un gráfico de dispersión y la línea de tendencia para dos variables que son negativamente correlacionado.

gráfico de dispersión de dos variables correlacionadas negativamente con una línea de tendencia.
gráfico de dispersión de dos variables correlacionadas negativamente con una línea de tendencia.

El gráfico de dispersión muestra que a medida que aumenta X, Y tiende a decrease- la línea de tendencia tiene una negativo cuesta abajo. Por lo tanto, X e Y son negativamente correlacionado.

La siguiente figura muestra un gráfico de dispersión y la línea de tendencia para dos variables que son correlacionadas.

gráfico de dispersión de dos variables no están correlacionadas con una línea de tendencia.
gráfico de dispersión de dos variables no están correlacionadas con una línea de tendencia.

El gráfico de dispersión muestra que a medida que aumenta X, Y a veces aumenta y disminuye a veces. No hay un patrón particular, a los datos. Los puntos parecen estar dispersas aleatoriamente a través del diagrama. Como resultado, la línea de tendencia es casi plana, y esto demuestra que X e Y son correlacionadas.

Para un ejemplo del mundo real, esta figura muestra un diagrama de dispersión de la relación entre el precio de las acciones de Apple y el estándar y el índice del mercado de valores de 500 Pobre de 1 en 2013 a 31 dic 2013.

gráfico de dispersión de los precios diarios de las acciones de Apple y el S & amp; P 500.

Video: Diagramas de Dispersion en analisis de Correlacion Lineal

gráfico de dispersión de los precios diarios de las acciones de Apple y el S&P 500.

El Standard & Poor `s 500 (S&P 500) de índice es un promedio de los precios de los 500 acciones de Estados Unidos más grandes. El valor de este índice refleja el estado general de la economía EE.UU.. El gráfico muestra que existe una correlación positiva entre el precio de las acciones de Apple y el S&P 500.

Artículos Relacionados