El método de arranque para los errores estándar e intervalos de confianza

Se puede calcular el error estándar (SE) e intervalo de confianza (IC) de las estadísticas de la muestra más comunes (medias, proporciones, los recuentos de eventos y tarifas, y coeficientes de regresión). Pero una SE y CI existen (teóricamente, al menos) para alguna Número de lo que pueda extraer de los datos - medianas, percentiles, coeficientes de correlación y otras cantidades que podrían implicar cálculos complicados, como el área bajo una curva de concentración frente al tiempo (AUC) o la probabilidad de supervivencia a cinco años estimado derivado de una análisis de supervivencia. Fórmulas para la SE y CI en torno a estos números podrían no estar disponibles o podrían ser irremediablemente difíciles de evaluar. Además, las fórmulas que existen podrían aplican sólo a los números de distribución normal, y es posible que no sea seguro de qué tipo de distribución sigue sus datos.

Considere un problema muy simple. Supongamos que ha medido la CI de 20 sujetos y han conseguido los siguientes resultados: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114 , 115, 120, y 138. Estos números tienen una media de 100,85 y una mediana de 99,5. Porque eres un buen científico, sabe que cada vez que se reporta un número que haya calculado a partir de los datos (como una media o mediana), también querrá para indicar la precisión de ese valor en forma de una SE y CI.

Para la media, y si se puede asumir que los valores de CI son una distribución aproximadamente normal, las cosas son bastante simples. Se puede calcular el SE de la media como 3,54 y el IC del 95% alrededor de la media como 93,4 a 108,3.

Pero ¿qué pasa con la SE y CI para la mediana, para los que no existen fórmulas simples? ¿Y si no se puede estar seguro de esos valores de CI provienen de una distribución normal? A continuación, las fórmulas simples podrían no ser fiables.

Afortunadamente, hay un método muy general para la estimación de la SE y de la CEI para cualquier cosa que se puede calcular a partir de sus datos, y que no requiere ninguna hipótesis sobre cómo se distribuyen sus números. El SE de cualquier estadística de la muestra es la desviación estándar (SD) de la distribución de muestreo para esa estadística. Y los límites de confianza del 95% de una muestra estadística son bien aproximada por la 2,5º y centiles 97,5 de la distribución de muestreo de esa estadística.

Así que si usted podría replicar todo el experimento muchas miles de veces (usando una muestra diferente de los sujetos cada vez), y cada Calcular tiempo y guardar el valor de lo que le interesa (mediana, AUC, o lo que sea), esta colección de miles de valores serían una muy buena aproximación a la distribución muestral de la cantidad de interés. Posteriormente, se podría estimar la SE simplemente como la desviación estándar de la distribución de muestreo y los límites de confianza de los percentiles de la distribución.

Pero en realidad llevar a cabo este escenario no es factible - es probable que no tiene el tiempo, la paciencia, o el dinero para llevar a cabo la totalidad de sus miles de veces de estudio. Afortunadamente, usted no tiene que repetir los miles de estudios de veces para obtener una estimación de la distribución de muestreo. Puede hacerlo mediante la reutilización de los datos de su estudio real uno, una y otra vez! Esto puede sonar demasiado bueno para ser verdad, y los estadísticos eran muy escépticos de este método cuando se propuso por primera vez. Lo llamaron bootstrapping, comparándolo con la imposible tarea de “recoger hacia arriba por sus propios esfuerzos.”

Pero resulta que si se mantiene la reutilización de los mismos datos en cierta forma, este método funciona realmente. Con los años, el procedimiento de arranque se ha convertido en una forma aceptada para obtener estimaciones fiables de la SE y de la CEI para casi cualquier cosa se puede calcular a partir de su Data-, de hecho, es a menudo considerado como el “patrón oro” contra la que diversas fórmulas de aproximación para las SE y cis son juzgados.

Para ver cómo funciona el método de arranque, así es como se usaría para estimar la SE y el IC del 95% de la media y la mediana de los 20 valores de CI mostrados anteriormente. Tienes que volver a muestrear sus 20 números, una y otra vez, de la siguiente manera:

Video: Intervalo de confianza 05 para la media ejercicio resuelto

  1. Escriba cada una de sus medidas en una hoja de papel por separado y se los puso en una bolsa.

    En este ejemplo, se escriben las 20 CI medidos en pedazos separados.

  2. Meter la mano y sacar un resbalón, escribir ese número, y poner la hoja de nuevo en la bolsa.

    (Esto último es muy importante!)

  3. Repita el paso 2 tantas veces como sea necesario para que coincida con el número de mediciones que tiene, devolviendo el deslizamiento de la bolsa cada vez.

    Esto se llama remuestreo con replacemeNuevo Testamento, y se produce una resampled conjunto de datos. En este ejemplo, se repita el paso 2 19 veces más, para un total de 20 veces (que es el número de mediciones de CI que tiene).

  4. Calcula la estadística de muestra deseada de los números resampled de los pasos 2 y 3, y registrar ese número.

    Video: 002 SPSS Intervalos de confianza 01 proporción

    En este ejemplo, se encuentra la media y la mediana de los 20 números resampled.

  5. Repita los pasos 2 a 4 miles de veces.

    Cada vez, generar un nuevo conjunto de datos muestreada de nuevo desde el que calcular y registrar las estadísticas de la muestra deseado (en este caso, la media y la mediana del conjunto de datos resampled). Como resultado, terminamos con miles de valores para la media y miles de valores de la mediana.

    En cada conjunto de datos resampled, algunos de los valores originales pueden ocurrir más de una vez, y algunos pueden no estar presentes en absoluto. Casi cada conjunto de datos resampled será diferente de todos los demás. El método de arranque se basa en el hecho de que estos significan y valores de la mediana de los miles de conjuntos de datos remuestreados comprenden una buena estimación de la distribución de muestreo para la media y la mediana. En conjunto, se parecen al tipo de resultados que mayo han obtenido si hubiera repetido el estudio real una y otra vez.

  6. Se calcula la desviación estándar de sus miles de valores de la estadística muestra.

    Este proceso le da una estimación “bootstrap” de la SE de la muestra estadística. En este ejemplo, se calcula la desviación estándar de los miles de medios para obtener el SE de la media, y se calcula la desviación estándar de los miles de medianas para obtener el SE de la media.

  7. Obtener el 2,5º y percentiles 97,5 de los miles de valores de la estadística muestra.

    Para ello, la clasificación de sus miles de valores de la estadística de la muestra en orden numérico, y luego cortando la más baja de 2,5 por ciento y el 2,5 por ciento más alto del conjunto ordenado de números. Los valores mínimos y máximos que quedan son la estimación bootstrap de los límites inferior y superior de confianza del 95% para la muestra estadística.

    En este ejemplo, la 2,5º y centiles 97,5 de las medias y medianas de los miles de conjuntos de datos remuestreados son los límites de confianza del 95% para la media y la mediana, respectivamente.

Obviamente nunca se iba a tratar de hacer este proceso de bootstrapping a mano, pero es muy fácil de hacer con un software como el programa gratuito Statistics101. Puede introducir sus resultados observados y decirle que para generar, por ejemplo, 100.000 conjuntos de datos nueva muestra, calcular y guardar la media y la mediana de cada uno, y luego calcular el SD y el 2,5º y percentiles 97,5 de esos medios y 100.000 100.000 las medianas. Aquí están algunos resultados de un análisis de arranque realizado en estos datos:

Información actual: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114, 115, 120, y 138. Mean = 100.85- La mediana = 99,5

Resampled conjunto de datos #1: 61, 88, 88, 89, 89, 90, 92, 93, 98, 102, 105, 105, 105, 109, 109, 109, 109, 114, 114, y 120. Mean1 = 99,45, mediana1 = 103,50

Resampled conjunto de datos #2: 61, 88, 89, 89, 90, 92, 92, 98, 98, 98, 102, 105, 105, 108, 108, 113, 113, 113, 114, y 138. Mean2 = 100,7, Median2 = 100,0

(Entre Set # 2 y el siguiente conjunto, se generaron 99,996 conjuntos de datos más bootstrap.)

Resampled conjunto de datos #99,999: 61, 61, 88, 89, 92, 93, 93, 94, 98, 98, 98, 101, 102, 105, 109, 114, 115, 120, 120, y 138. Mean99999 = 99,45, mediana99999 = 98.00

Resampled conjunto de datos #100,000: 61, 61, 61, 88, 89, 89, 90, 93, 93, 94, 102, 105, 108, 109, 109, 114, 115, 115, 120, y 138. Mean100.000 = 97,7, Median100.000 = 98,0

He aquí un resumen de los 100.000 vuelve a muestrear:

  • La desviación estándar de los 100.000 medias = 3.46- este es el bootstrap SE de la media (SEM).

  • La desviación estándar de los 100.000 medianas = 4.24- este es el bootstrap SE de la mediana.

  • Los 2,5º y 97,5 percentiles de los 100.000 medio = 94,0 y 107.6- estos son los límites de confianza del 95% para el bootstrapped media.

  • Los 2,5º y 97,5 percentiles de los 100.000 medianas = 92,5 y 108.5- estos son los límites de confianza del 95% para el bootstrapped mediana.

Por lo que sería reportar su media y la mediana, junto con sus errores típicos bootstrap y el 95% intervalo de confianza de esta manera:

Media = 100,85 ± 3,46 (94,0-107,6) - La mediana = 99,5 ± 4,24 (92,5 a 108,5).

Se dará cuenta de que la SE es mayor (y el CI es más ancha) para la mediana que para la media. Esto es generalmente cierto para los datos distribuidos normalmente - la mediana tiene alrededor de 25% más variabilidad que la media. Pero para datos no distribuidos normalmente, la mediana es a menudo más precisa que la media.

No es necesario utilizar bootstrapping para algo tan simple como la SE o CI de una media porque hay fórmulas simples para eso. Pero el método de arranque simplemente puede calcular fácilmente la SE o CI para una mediana, un coeficiente de correlación, o un parámetro farmacocinético como el AUC o vida media de eliminación de un fármaco, para el que no hay simples fórmulas SE o CI y para el cual los supuestos de normalidad no sean aplicables.

Bootstrapping es conceptualmente simple, pero no es infalible. El método implica ciertas suposiciones y tiene ciertas limitaciones. Por ejemplo, es probable que no va a ser muy útil si usted tiene sólo unos pocos valores observados. Revisa Estadísticas 101 para obtener más información sobre cómo utilizar el método de arranque (y para el software Statistics101 libre de hacer los cálculos de rutina de carga muy fácilmente).

Artículos Relacionados