Top 10 fórmulas estadísticas

Fórmulas - que simplemente no pueden alejarse de ellos cuando estás estudiando estadísticas. Aquí hay diez fórmulas estadísticas que va a utilizar con frecuencia y los pasos para su cálculo.

Proporción

Algunas variables son categóricas e identificar qué categoría o grupo a un individuo pertenece. Por ejemplo, “estado civil” es una variable categórica, y un individuo podría ser único, que data, casado, divorciado, y así sucesivamente.

El número real de individuos en cualquier categoría dada se denomina frecuencia para esa categoría. UN proporción, o Frecuencia relativa, representa el porcentaje de individuos que cae en cada categoría. La proporción de una categoría dada, denotada por pag, es la frecuencia dividida por el tamaño total de la muestra.

Así que para calcular la proporción, se

  1. Contar todos los individuos de la muestra que caen en la categoría especificada.

  2. Dividido por norte, el número de individuos de la muestra.

Media

los media, o el promedio de un conjunto de datos, es una forma de medir el centro de un conjunto de datos numéricos. La notación para la media es

La fórmula para la media es

dónde x representa cada uno de los valores en el conjunto de datos.

Para calcular la media, se

  1. Sumar todos los números en el conjunto de datos.

  2. Dividido por norte, el número de valores en el conjunto de datos.

Mediana

los mediana de un conjunto de datos numéricos es otra manera de medir el centro. La mediana es el valor medio después de solicitar los datos de menor a mayor.

Para calcular la mediana, seguir los siguientes pasos:

  1. Ordenar los números de menor a mayor.

  2. Por una cantidad impar de números, elija el que cae exactamente en el medio. Usted ha identificado el medio.

  3. Por la misma cantidad de números, de los dos números exactamente en el medio y el promedio de ellos para encontrar la mediana.

desviación estándar de la muestra

los desviación estándar de una muestra es una medida de la cantidad de variabilidad en la muestra. Se puede pensar en que, en términos generales, como la distancia media de la media. La fórmula para la desviación estándar es

Para calcular la desviación estándar,

  1. Encuentra el promedio de todos los números,

  2. Tome cada número y restar la media de la misma.

  3. Cuadrados cada uno de los valores resultantes.

  4. Añadir a todos ellos.

  5. Dividido por norte - 1.

  6. Tomar la raíz cuadrada.

percentil

percentiles son una forma de determinar un valor relativo individual a todos los otros valores en un conjunto de datos. Al tomar una prueba estandarizada, se obtiene un puntaje bruto individual y un percentil. Si viene en en el percentil 90, por ejemplo, el 90 por ciento de los resultados de las pruebas de todos los estudiantes son los mismos que los suyos o por debajo (y el 10 por ciento están por encima de la suya). En general, estar en el kmedios percentil k por ciento de los datos mentira en o por debajo de ese punto y (100 - k) Por ciento mentira por encima de ella.

Para calcular un percentil, se

  1. Convertir el valor original a una medición estándar mediante el uso de la z-fórmula,

    dónde x es el valor original,

    es la media de la población de todos los valores, y

    es la desviación estándar de la población de todos los valores.

  2. Utilizar el Z-tabla para encontrar el percentil correspondiente para la puntuación estándar.

Margen de error de la media de la muestra

los margen de error para su mea muestranorte,

es la cantidad que espera que la media de la muestra a variar de una muestra a otra. La fórmula para el margen de error para

tratar con muestras de tamaño 30 o más, es

dónde z* Es el valor normal estándar para el nivel de confianza que desee.

Para calcular el margen de error para

  1. Determinar el nivel de confianza y encontrar el adecuado z*.

  2. Encuentra la desviación estándar

    y el tamaño de la muestra, norte.

  3. Multiplicar z* por

    dividido por la raíz cuadrada de norte.

Tamaño de la muestra necesario

Si desea calcular un intervalo de confianza para la media poblacional con un cierto margen de error, se puede averiguar el tamaño de la muestra que necesita antes de recoger los datos. La fórmula para el tamaño de la muestra para

es

dónde z* Es el valor normal estándar para el nivel de confianza, MOE es su margen de error deseado, y

es la desviación estándar. Porque

es un valor desconocido que es necesario, es posible que tenga que hacer un estudio piloto (pequeño estudio experimental) para llegar a una estimación para el valor de la desviación estándar.

Para calcular el tamaño de la muestra para

correr a través de los siguientes pasos:

  1. Multiplicar z* Los tiempos s.

  2. Dividir por el margen de error deseado, MOE.

  3. Cuadrar ella.

  4. Redondo alguna cantidad fraccionaria al número entero más próximo (por lo que lograr su MOE deseado o mejor).

estadística de prueba para la media

Cuando se realiza una prueba de hipótesis para la media poblacional, se toma la media de la muestra y averiguar hasta qué punto es desde el valor reclamado en términos de una puntuación estándar. La puntuación estándar se denomina estadísti de pruebado. La fórmula para la estadística de prueba para la media es

dónde

es el valor reivindicado para la media de la población (El valor que se encuentra en la hipótesis nula).

Para el cálculo de la estadística de prueba para la media de la muestra para muestras de tamaño 30 o más,

  1. Calcular la media muestral,

    y la desviación estándar de la muestra, s.

  2. Tomar

  3. Calcular el error estándar,

  4. Divida su resultado del paso 2 por el error estándar que se encuentra en el Paso 3.

Correlación

Muestra correlación es una medida de la fuerza y ​​la dirección de la relación lineal entre dos variables cuantitativas x y Y. No mide cualquier otro tipo de relación, y no se aplica a las variables categóricas. La fórmula para la correlación es

Video: FÓRMULAS ESTADÍSTICAS BÁSICAS - PARTE 1

Para el cálculo de la correlación, se

  1. Encuentra la media de todas las x valores y lo llaman

    Encuentra la media de todas las y valores y lo llaman

  2. Encuentra la desviación estándar de toda la x valores y lo llaman sx. Encuentra la desviación estándar de toda la y valores y lo llaman sy.

    Video: Fórmulas Estadísticas en Excel

  3. Para cada (x, y) Par en el conjunto de datos, tomar x menos

    y y menos

    y multiplicar juntos.

  4. Añadir todos estos productos en conjunto para obtener una suma.

  5. Dividir la suma por sx x sy.

  6. Dividir el resultado por n - 1, donde norte es el número de (x, y) pares. (Esto es lo mismo que multiplicar por uno más de n - 1.)

Línea de regresión

Después de examinar un diagrama de dispersión entre dos variables numéricas y de cálculo de la correlación de la muestra entre las dos variables, es posible observar una relación lineal entre ellos. En ese caso, sería apropiado para estimar una línea de regresión para estimar el valor de la variable de respuesta (Y) Dado un valor para la variable explicativa (x).

Antes de calcular la línea de regresión, se necesitan cinco estadísticas de resumen:

  • La media de la x valores

  • La media de la y valores

  • La desviación estándar de la x valores (denotados sx)

  • La desviación estándar de la y valores (denotados sy)

  • La correlación entre x y Y (denotado r)

Por lo tanto, para calcular la línea de regresión de mejor ajuste, se

  1. Encuentra la pendiente usando la fórmula

  2. Encuentra el y-interceptar utilizando la fórmula

  3. Reconstruir los resultados de los pasos 1 y 2 para darle la recta de regresión: y = mx + segundo.

Artículos Relacionados