Resumir los datos agrupados con bares, cajas y bigotes

A veces se quiere mostrar como una variable varía de un grupo de sujetos a otro. Por ejemplo, los niveles en sangre de algunas enzimas varían entre las diferentes razas. Dos tipos de gráficos se utilizan comúnmente para este propósito: gráficos de barras y diagramas de caja y patillas.

Gráfica de barras

Una forma sencilla de mostrar y comparar las medias de varios grupos de datos es con un gráfico de barras, como el que se muestra, donde la altura de la barra para cada carrera es igual a la media (o mediana o media geométrica) valor del nivel de enzima para la que carrera.

Video: Cuartiles, rango intercuartil, caja y bogites

Y el gráfico de barras se vuelve aún más informativo si indica la difusión de valores para cada carrera por la colocación de líneas que representan una desviación estándar por encima y por debajo de las copas de los bares. Estas líneas siempre se denominan barras de error (Una desafortunada elección de palabras que pueden causar confusión cuando se añaden barras de error a un gráfico de barras).

Pero incluso con barras de error, un gráfico de barras aún no da una muy buena imagen de la distribución de la enzima de niveles dentro de cada grupo. Están sesgados los valores? ¿Hay valores atípicos? La media y la SD pueden no ser muy informativo si los valores se distribuyen log-normal o de otra manera inusual.

Idealmente, usted quiere mostrar un histograma para cada grupo de sujetos, pero que puede tomar hasta demasiado espacio. ¿Qué debe hacer? Continúa leyendo para averiguarlo.

diagramas de caja y patillas

Afortunadamente, otro tipo de gráfico que llama diagrama de caja y bigotes- (o segundo&W, o solo Caja trama) Muestra - en muy poco espacio - una gran cantidad de información acerca de la distribución de los números en uno o más grupos de sujetos. Un simple B&W gráfica de los mismos datos de enzimas ilustradas con un gráfico de barras anterior se muestra a continuación, a la izquierda.

el B&figura W para cada grupo por lo general tiene las siguientes partes:

  • Una caja que abarca el rango intercuartílico (IQR), que se extiende desde el primer cuartil (25a percentil) para el tercer cuartil (percentil 75) de los datos, y por lo tanto que abarca el 50 por ciento de los datos

  • Una línea horizontal gruesa, dibujado en la mediana (50a centil), que a menudo pone en o cerca del centro de la caja

  • Las líneas discontinuas (barbas) que se extienden hacia fuera al punto de datos más lejano que no es más de 1,5 veces el IQR lejos de la caja

  • Los puntos individuales que están fuera de los bigotes, consideran valores atípicos

segundo&parcelas W proporcionan un resumen útil de la distribución. Un medio que no está situado cerca de la mitad de la caja indica una distribución asimétrica.

Algunos software dibuja las diferentes partes de un B&trama W de acuerdo con reglas diferentes (la línea horizontal puede estar en la media en lugar de la-mediana la caja puede representar la media estándar ± 1 desviación-los bigotes se pueden extender a la más lejana outliers- y así sucesivamente). Siempre consulte la documentación del software y proporcionar la descripción de las partes siempre que se presente un B&W trama.

Algunos programas de software ofrece varias mejoras en el básico B&W trama. La figura a la derecha de la trama sencilla cuadro ilustra dos de estos adornos usted puede considerar el uso de:

  • anchura variable: Las anchuras de las cajas se pueden escalar para indicar el tamaño relativo de cada grupo. Se puede ver que hay un número considerablemente menor asiáticos y los “otros” que los blancos o negros.

  • muescas: La caja puede tener muescas que indican la incertidumbre en la estimación de la mediana. Si dos grupos tienen muescas que no se solapan, que probablemente tienen significativamente diferentes puntos medios. Los blancos y los “otros” tener los niveles de enzimas mediana similares, mientras que los asiáticos tienen niveles significativamente más altos y negros tienen niveles significativamente más bajos.

Artículos Relacionados