Cómo calcular una correlación

Can una medida estadística tanto la fuerza y ​​la dirección de una relación lineal entre dos variables? ¡Por supuesto! Los estadísticos utilizan la coeficiente de correlación para medir la fuerza y ​​la dirección de la relación lineal entre dos variables numéricas x y Y. El coeficiente de correlación para una muestra de datos se denota por r.

Video: Calcular el coeficiente de correlacion

Aunque la definición de la calle correlación se aplica a cualquiera de los dos elementos que están relacionados (como el género y la afiliación política), los estadísticos utilizan este término sólo en el contexto de dos variables numéricas. El término formal para la correlación es la coeficiente de correlación. Muchos diferentes medidas de correlación se han creado- la utilizada en este caso se llama el coeficiente de correlación de Pearson.

La fórmula para la correlación (r) es

dónde norte es el número de pares de datos;

Video: Coeficiente de correlacion simple

son los medios muestra de todas las x-valores y todo el y-valores, respectivamente- y sx y sy son las desviaciones estándar de la muestra de toda la x- y y-valores, respectivamente.

Se pueden utilizar los siguientes pasos para calcular la correlación, r, de un conjunto de datos:

  1. Encuentra la media de todas las x-valores

  2. Encuentra la desviación estándar de toda la x-valores (llamarlo sx) Y la desviación estándar de todos los y-valores (llamarlo sy).

    Por ejemplo, para encontrar sx, se utilizaría la siguiente ecuación:

  3. Para cada una de las norte pares (x, y) En el conjunto de datos, tomar

  4. Sume el norte los resultados de la Etapa 3.

  5. Dividir la suma por sx * sy.

  6. Dividir el resultado por norte - 1, donde norte es el número de (x, y) pares. (Es el mismo que multiplicar por 1 sobre norte - 1.)

    Esto le da la correlación, r.

Por ejemplo, suponga que tiene el conjunto de datos (3, 2), (3, 3), y (6, 4). Se calcula el coeficiente de correlación r a través de los siguientes pasos. (Tenga en cuenta que para estos datos el x-valores son 3, 3, 6, y el y-valores son 2, 3, 4.)

  1. El cálculo de la media de los valores X e Y, se obtiene

  2. Las desviaciones estándar son sx = 1,73 y sy = 1.00.

  3. los norte = 3 diferencias encontradas en el Paso 2 multiplican entre sí son: (3 - 4) (2 - 3) = (- 1) (- 1) = + 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6 - 4) (4 - 3) = (2) (1) = 2.

    Video: Significado del coeficiente de correlacion de pearson

  4. la adición de la norte = 3 Paso 3 resultados, se obtiene 1 + 0 + 2 = 3.

  5. dividiendo por sx * sy que 3 / (1,73 * 1,00) = 3 / 1,73 = 1,73 da. (Es sólo una coincidencia que el resultado del paso 5 también es 1,73.)

  6. Ahora divida el resultado Paso 5 por 3 - 1 (que es 2), y se obtiene la correlación r = 0.87.

    Video: Cómo calcular el Coeficiente de Correlación de Pearson en Excel (COEF.DE.CORREL)

Artículos Relacionados