Cómo calcular la diferencia entre dos proporciones

Para estimar la diferencia entre dos proporciones de la población con un nivel de confianza, puede utilizar el teorema del límite central cuando los tamaños de las muestras son lo suficientemente grandes (por lo general, cada uno, al menos, 30). Cuando un parámetro característico estadístico, tal como la opinión sobre un tema (soporte / no soporte), de los dos grupos que se comparan es categórico, la gente quiere informar acerca de las diferencias entre las dos proporciones de la población - por ejemplo, la diferencia entre la proporción de mujeres y hombres que apoyan a la semana laboral de cuatro días. ¿Cómo haces esto?

A calcular la diferencia entre dos proporciones de la población, pag1 - pag2, tomando una muestra de cada población y el uso de la diferencia de las dos proporciones de la muestra,

más o menos un margen de error. El resultado se llama intervalo de confianza para la diferencia de dos proporciones de la población, p1 - pag2.

La fórmula para un intervalo de confianza (CI) para la diferencia entre dos proporciones de la población es

y norte1 son el tamaño proporción de la muestra y la muestra de la primera muestra, y

y norte2 son la proporción de la muestra y tamaño de la muestra de la segunda muestra. El valor z * es el valor apropiado de la distribución normal estándar para el nivel de confianza deseado. (Consulte la tabla siguiente para obtener z *-valores.)

z*-valores para varios niveles de confianza
Nivel de confianzaz * -valor
80%1.28
90%1.645 (por convención)
95%1.96
98%2.33
99%2.58

Para calcular un IC para la diferencia entre dos proporciones poblacionales, haga lo siguiente:

  1. Determinar el nivel de confianza y encontrar el adecuado z *-valor.

    Referirse a la tabla anterior.

  2. Encuentra la proporción muestral

    para la primera muestra, tomando el número total de la primera muestra que se encuentran en la categoría de interés y dividiendo por el tamaño de la muestra, norte1. Del mismo modo, encontrar

    para la segunda muestra.

  3. Tome la diferencia entre las proporciones de la muestra,

  4. Encontrar

    Video: ESTADÍSTICA INFERENCIAL I, EJERCICIO 19: DISTRIBUCIÓN DIFERENCIA DE PROPORCIONES MUESTRALES

    y dividir que para el norte1. Encontrar

    y dividir que para el norte2. Añadir estos dos resultados juntos y sacar la raíz cuadrada.

  5. Multiplicar z * veces el resultado del paso 4.

    Este paso le da el margen de error.

  6. Tomar

    Video: Intervalo de confianza para la diferencia de dos proporciones usando Excel

    más o menos el margen de error de la etapa 5 para obtener el CI.

    El extremo inferior de la CI es

    menos el margen de error, y el extremo superior de la CI es

    más el margen de error.

La fórmula que se muestra aquí para una CI para pag1 - pag2 se utiliza bajo la condición de que ambos de los tamaños de las muestras son lo suficientemente grandes para el teorema del límite central a aplicar y le permiten utilizar una z* -value- esto es cierto cuando se está estimando proporciones utilizando encuestas a gran escala, por ejemplo. Para los pequeños tamaños de muestra, los intervalos de confianza están más allá del alcance de un curso de introducción estadísticas.

Supongamos que usted trabaja para la Cámara de Comercio de Las Vegas, y desea estimar con confianza del 95% de la diferencia entre el porcentaje de todas las mujeres que alguna vez han ido a ver a un imitador de Elvis y el porcentaje de todos los hombres que nunca han ido a ver una imitador de Elvis, con el fin de ayudar a determinar cómo se debe comercializar sus ofertas de entretenimiento.

  1. Porque desea un intervalo de confianza del 95%, su z *-valor es 1,96.

  2. Supongamos que la muestra aleatoria de 100 mujeres incluye 53 mujeres que han visto un imitador de Elvis, por lo

    es de 53 dividido por 100 = 0,53. Supongamos también que la muestra aleatoria de 110 hombres incluye 37 hombres que han visto nunca un imitador de Elvis, por lo

    es de 37 dividido por 110 = 0,34.

  3. La diferencia entre estas proporciones de la muestra (hembras - machos) es desde 0,53 hasta 0,34 = 0,19.

  4. Tome 0,53 * Resultados (1 - 0,53) para obtener 0,2941. Luego divida ese por 100 para obtener 0,0025. Luego tome 0,34 * Resultados (1 - 0,34) para obtener 0,2244. Luego divida ese por 110 para obtener 0,0020. Añadir estos dos resultados para obtener 0,0025 + 0,0020 = 0,0045. A continuación, busque la raíz cuadrada de 0,0045, que es 0.0671.

  5. 1,96 * 0,0671 le da 0,13, o 13%, que es el margen de error.

  6. Su 95% intervalo de confianza para la diferencia entre el porcentaje de mujeres que han visto un imitador de Elvis y el porcentaje de hombres que han visto un imitador de Elvis es de 0,19 o 19% (lo que tienes en el paso 3), más o menos el 13%. El extremo inferior del intervalo es de 0,19 - 0,13 = 0,06 o 6% - el extremo superior es 0,19 + 0,13 = 0,32 o 32%.

    Para interpretar estos resultados dentro del contexto del problema, se puede decir con una confianza del 95% de que un mayor porcentaje de mujeres que en hombres han visto un imitador de Elvis, y la diferencia en estos porcentajes está en algún lugar entre el 6% y el 32%, en función de su muestra.

    La tentación es decir, “Bueno, yo sabía que una mayor proporción de mujeres que ha visto un imitador de Elvis, ya que la proporción de la muestra fue de 0,53 y para los hombres fue sólo 0,34. ¿Por qué me necesito un intervalo de confianza?”Todos esos dos números dicen que es algo acerca de esas 210 personas muestreadas. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre toda la población de hombres y mujeres.

Por supuesto, hay algunos chicos por ahí que no admitiría que habían visto un imitador de Elvis (aunque probablemente he pretendido ser uno haciendo karaoke en algún momento). Esto puede crear un sesgo en los resultados.

Tenga en cuenta que usted puede obtener un valor negativo para

Por ejemplo, si usted hubiera cambiado los machos y las hembras, se habría conseguido -0.19 para esta diferencia. Eso está bien, pero se puede evitar diferencias negativas de las proporciones de la muestra por tener el grupo con la proporción mayor de muestras sirven como el primer grupo (en este caso, las hembras).

Sin embargo, incluso si el grupo con la proporción de muestra más grande sirve como el primer grupo, a veces usted todavía obtener valores negativos en el intervalo de confianza. Supongamos que en el ejemplo anterior que sólo 0,43 de las mujeres habían visto un imitador de Elvis. Por lo tanto, la diferencia en las proporciones es 0,09, y el extremo superior del intervalo de confianza es 0,09 + 0,13 = 0,22 mientras que el extremo inferior es 0,09 - 0,13 = -0,04. Esto significa que la diferencia real es razonablemente en cualquier lugar del 22% a más mujeres a 4% más hombres. Es demasiado cerca de saber con seguridad.

Artículos Relacionados