Lo que es un diagrama de caja le puede informar sobre un conjunto de datos estadísticos

Un diagrama de caja le puede dar información sobre la forma, la variabilidad, y el centro (o mediana) De un conjunto de datos estadísticos. Es particularmente útil para la visualización de datos asimétricos. Los datos estadísticos también se pueden visualizar con otra diagramas y gráficos.

Lo que revela la forma gráfica de caja sobre un conjunto de datos estadísticos

Un diagrama de caja puede mostrar si un conjunto de datos es simétrica (más o menos la misma en cada lado cuando se corta por la mitad) o inclinada (torcida). Un conjunto de datos simétrica muestra la mediana aproximadamente en el centro de la caja.

La mediana, parte del resumen de cinco números, se muestra por la línea que corta a través de la caja en el diagrama de caja.

Los datos asimétricos muestran un diagrama de caja ladeada, donde la mediana corta la caja en dos piezas desiguales. Si la parte más larga de la caja está a la derecha (o por encima) de la mediana, se dice que los datos que se sesgada a la derecha. Si la parte más larga está a la izquierda (o debajo) de la mediana, los datos se izquierda sesgada.

n = 83 actrices) “. />
Diagrama de caja de las mejores edades actriz (1928-2009- norte = 83 actrices).

En la figura anterior, las edades están sesgadas a la derecha. La parte de la caja a la izquierda de la mediana (en representación de las actrices más jóvenes) es más corta que la parte a la derecha de la mediana (en representación de las actrices de más edad). Eso significa que las edades de las actrices más jóvenes están más juntas que las edades de las actrices de más edad.

Las estadísticas descriptivas para las edades Mejores actriz (1928-2009).
Las estadísticas descriptivas para las edades Mejores actriz (1928-2009).

Esta figura muestra las estadísticas descriptivas de los datos y confirma la asimetría derecha: la mediana de edad (33 años) es más baja que la media de edad (35,69 años).

Si un lado de la caja es más largo que el otro, esto no significa que ese lado contiene más datos. De hecho, no se puede saber el tamaño de la muestra mirando un boxplot- se basa en porcentajes del tamaño de la muestra, no el tamaño de la muestra en sí. Cada sección del diagrama de caja (el mínimo para Q1, Q1 a la mediana, la mediana de Q3, y Q3 al máximo) contiene 25% de los datos no importa qué. Si una de las secciones es más largo que otro, esto indica una gama más amplia de los valores de los datos en esa sección (que significa que los datos son más extendidas). Una sección más pequeña del diagrama de caja indica los datos son más condensados ​​(más cerca juntos).

Aunque un diagrama de caja puede decir si un conjunto de datos es simétrica (cuando la media está en el centro de la caja), no se puede decir la forma de la simetría de la forma en que una lata histograma.

Los histogramas de dos conjuntos de datos simétricos
Los histogramas de dos conjuntos de datos simétricos

Video: DIAGRAMAS DE CAJA (O DE CAJA Y BIGOTES). HD

Por ejemplo, la figura de arriba muestra histogramas de dos conjuntos de datos diferentes, cada una que contiene 18 valores que varían de 1 a 6. El histograma de la izquierda tiene un número igual de valores en cada grupo, y el de la derecha tiene dos picos a los 2 y 5. los dos histogramas muestran los datos son simétricas, pero sus formas son claramente diferentes.

Boxplots de los dos conjuntos de datos simétricos de la figura anterior

Video: Estadistica 1 - Diagrama de Cajas

Boxplots de los dos conjuntos de datos simétricos de la figura anterior

Esta figura muestra los diagramas de caja correspondientes para notar estos dos mismos datos Conjuntos- que son exactamente lo mismo. Esto se debe a que los conjuntos de datos que ambos tienen las mismas resúmenes de cinco números - los dos son simétricos con la misma cantidad de distancia entre Q1, la mediana, y Q3. Sin embargo, si usted acaba de ver los diagramas de caja y no los histogramas, se podría pensar que las formas de los dos conjuntos de datos son los mismos, cuando de hecho no lo son.

A pesar de su debilidad en la detección del tipo de simetría (se puede añadir en un histograma para sus análisis para ayudar a llenar ese hueco), un diagrama de caja tiene un gran revés en que se puede identificar medidas reales de propagación y el centro directamente del diagrama de caja, donde en un histograma no se puede. Un diagrama de caja también es bueno para la comparación de conjuntos de datos, mostrándoles en el mismo gráfico, de lado a lado.

Lo que es un diagrama de caja revela acerca de la variabilidad de un conjunto de datos estadísticos

La variabilidad en un conjunto de datos que se describe por el resumen de cinco números se mide por la rango intercuartil (RIC). los RIC es igual a Q3 - Q1, la diferencia entre el percentil 75 y el percentil 25 (la distancia que cubre el 50% central de los datos). Cuanto mayor sea el RIC, el más variables del conjunto de datos es.

Video: Estadística - Ejercicio resuelto utilizando un Diagrama de Venn, Ejemplo encuesta sobre lectores

En la figura anterior muestra las estadísticas descriptivas para las edades Mejores Actriz, la variabilidad en la edad de los mejores ganadores Actriz, medida por el RIC, es Q3 - Q1 = 39 - 28 = 11 años. Del grupo de actrices cuyas edades estaban más cerca de la mediana, la mitad de ellos estaban dentro de los 11 años de uno al otro cuando ganaron sus premios.

Observe que el RIC ignora los datos por debajo del percentil 25 o por encima de la 75a, que puede contener los valores atípicos que podrían inflar la medida de la variabilidad de todo el conjunto de datos. Así que si los datos son asimétricos, la RIC es una medida más apropiada de la variabilidad de la desviación estándar.

">
Artículos Relacionados