Cómo crear un intervalo de confianza para la diferencia de dos medias con desviaciones estándar desconocidos y / o pequeños tamaños de las muestras

Puede encontrar un intervalo de confianza (IC) para la diferencia entre las medias, o medias, de dos muestras de población, incluso si las desviaciones estándar de las poblaciones son desconocidas y / o los tamaños de las muestras son pequeñas. El objetivo de muchas encuestas y estudios estadísticos es comparar dos poblaciones, como los hombres frente a las mujeres, bajas en comparación con las familias de altos ingresos, y los republicanos contra los demócratas. Cuando el ser característica en comparación es numérico (por ejemplo, altura, peso, o ingreso), el objeto de interés es la cantidad de diferencia en las medias (medias) para las dos poblaciones.

Por ejemplo, es posible que desee comparar la diferencia en la edad media de los republicanos contra los demócratas, o la diferencia de los ingresos medios de los hombres frente a las mujeres. A calcular la diferencia entre las medias de dos poblaciones,

tomando una muestra de cada población (por ejemplo, la muestra 1 y la muestra 2) y usando la diferencia de las dos medias de la muestra

más o menos un margen de error. El resultado es una intervalo de confianza para la diferencia de dos medias de población,

Hay dos situaciones en las que no se puede utilizar z * cuando se calcula el intervalo de confianza. El primero de ellos es que si no sabes

En este caso es necesario estimar con las desviaciones estándar de la muestra, s1 y s2. La segunda situación es cuando los tamaños de las muestras son pequeñas (menos de 30). En este caso no se puede estar seguro de si los datos provienen de una distribución normal.

En cualquiera de estas situaciones, un intervalo de confianza para la diferencia en las dos medias de población es

dónde t * es el valor crítico de la t-con la distribución norte1 + norte2 - 2 grados de libertad- norte1 y N2 son los dos tamaños de muestra, respectivamente- y s1 y s2 son las dos desviaciones estándar de la muestra. Esta t *-valor se encuentra en la siguiente t-mesa por la intersección de la fila de df = norte1 + norte2 - 2 con la columna para el nivel de confianza que necesita, como se indica examinado la última fila de la tabla.

Para calcular un IC para la diferencia entre dos medias de población, hacer lo siguiente:

  1. Determinar el nivel de confianza y grados de libertad (norte1 + norte2 - 2) y encontrar el adecuado t *-valor.

    Refiérase a la anteriormente mesa.

  2. Identificar

    Identificar

  3. Encuentra la diferencia,

    entre las medias de la muestra.

  4. Calcular el intervalo de confianza usando la ecuación,

Suponga que desea estimar con confianza del 95%, la diferencia entre las longitudes media (promedio) de las mazorcas de dos variedades de maíz dulce (que les permite crecer el mismo número de días en las mismas condiciones). Llamar a las dos variedades de maíz-e-estadísticas (grupo 1) y Estadísticas-o-dulce (grupo 2). Suponga que usted no sabe las desviaciones estándar de las poblaciones, por lo que utilizar las desviaciones estándar de muestras en lugar - supongamos que resultan ser s1 = 0,40 y s2 = 0,50 pulgadas, respectivamente. Supongamos que los tamaños de las muestras, norte1 y norte2, son cada uno sólo 15.

  1. Para calcular el IC, primero tiene que encontrar la t * -valor en el t-de distribución con (15 + 15 - 2) = 28 grados de libertad. Usando la anteriormente t-mesa, nos fijamos en la fila para 28 grados de libertad y la columna que representa un nivel de confianza del 95% (ver las etiquetas en la última fila de la tabla) - ellos se cruzan y se ve t *28 = 2,048.

  2. Para ambos grupos, que tomó muestra aleatoria de 15 mazorcas, con la variedad de maíz-e-estadísticas promedio de 8,5 pulgadas, y Estadísticas-o-dulce 7,5 pulgadas. Por lo que la información que se tiene es:

  3. La diferencia entre las medias de la muestra

    es 8/5 a 7/5 = 1 pulgada. Esto significa que la media de maíz-e-estadísticas, menos de la media de Estadísticas-o-dulce es positivo, por lo Maíz-e-stats la mayor de las dos variedades, en términos de esta muestra. Es que la diferencia suficiente como para generalizar a toda la población, sin embargo? Eso es lo que este intervalo de confianza va a ayudar a decidir.

  4. Utilizando el resto de la información que se le da, encontrar el intervalo de confianza para la diferencia en la longitud media de la mazorca para las dos marcas:

    Su intervalo de confianza del 95% para la diferencia entre las longitudes medias de estas dos variedades de maíz dulce es de 1 pulgada, más o menos 0.9273 pulgadas. (El extremo inferior del intervalo es de 1 a 0,9273 = 0. 0727 pulgadas- el extremo superior es 1 + 0. 9273 = 1. 9.273 pulgadas). Observe todos los valores en este intervalo son positivos. Eso significa Maíz-e-estadísticas se estima en más de Estadísticas-o-dulce, sobre la base de sus datos.

    La tentación es decir, “Bueno, sabía de maíz Maíz-e-estadísticas era más larga, ya que su media de la muestra fue de 8,5 pulgadas y Stat-o-dulce era sólo 7,5 pulgadas de media. ¿Por qué me necesito un intervalo de confianza?”Todos esos dos números dicen que es algo acerca de esos 30 mazorcas de maíz en la muestra. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre las poblaciones enteras de maíz.

Artículos Relacionados