Como hacer un diagrama de caja de un resumen de cinco números

UN diagrama de caja es un gráfico unidimensional de datos numéricos basados ​​en el resumen de cinco números. Este resumen incluye las siguientes estadísticas: el valor mínimo, el percentil 25 (conocido como Q1), La mediana, el percentil 75 (Q3), Y el valor máximo. En esencia, estos cinco estadística descriptiva dividen el conjunto de datos en cuatro partes, donde cada parte contiene el 25% de los datos.

Para hacer un diagrama de caja, siga estos pasos:

Encontrar el resumen de cinco números del conjunto de datos:

los mínimo es el valor más pequeño en el conjunto de datos y la máximo es el valor más grande en el conjunto de datos. Utilice los siguientes pasos para encontrar el percentil 25 (conocido como Q1), El percentil 50 (la mediana), y el percentil 75 (Q3).

  1. Ordenar todos los valores en el conjunto de datos de menor a mayor.

  2. Multiplicar k ciento veces el número total de valores en los datos, norte.

    El resultado se conoce como el índice.

  3. Si el índice obtenido en el paso 2 no es un número entero, se redondeará al número entero más próximo y vaya al Paso 4a.

    Si el índice obtenido en la Etapa 2 es un número entero, ir al Paso 4b.

  4. Elige uno de los siguientes.

    a. Contar los valores en el conjunto de datos de izquierda a derecha (desde el más pequeño hasta el mayor valor) hasta llegar al número indicado por el paso 3. El valor correspondiente en el conjunto de datos es la kº percentil.

    segundo. Contar los valores en el conjunto de datos de izquierda a derecha (menor a mayor) hasta que llegue al número indicado por el paso 2. El kº percentil es el promedio de ese valor correspondiente en el conjunto de datos y el valor que sigue directamente.

  • Crear una línea de números vertical (u horizontal) cuya escala incluye los valores en el resumen de cinco números y utiliza unidades apropiadas de la misma distancia unos de otros.

  • Marque la ubicación de cada valor en el resumen de cinco números por encima de la línea de números (para un diagrama de caja horizontal) o justo a la derecha de la línea de números (para un diagrama de caja vertical).

  • Dibuje un cuadro alrededor de las marcas para el percentil 25 y el percentil 75.

  • Trazar una línea en la caja donde se encuentra la mediana.

  • Determinar si o no los valores atípicos están presentes.

    Para hacer esta determinación, se calcula el rango intercuartil (RIC), que se encuentra restando Q3 - Q1- luego se multiplica RIC por 1,5. Añadir esta cantidad por el importe de Q3 y restar esta cantidad de Q1. Esto le da un límite más amplio alrededor de la mediana que lo hace la caja. Todos los puntos de datos que caen fuera de este límite se determina que los valores atípicos.

  • Si no hay valores atípicos (de acuerdo a los resultados de la etapa 6), dibujar líneas desde los bordes superior e inferior de la caja fuera de los valores mínimo y máximo en el conjunto de datos.

    Video: Diagrama de cajas y bigotes con Excel

  • Si hay valores atípicos (de acuerdo a los resultados de la Etapa 6), indicar su ubicación en el diagrama de caja con signos *.

    En vez de dibujar una línea desde el borde de la caja todo el camino hasta el valor atípico más extrema, detener la línea en el último valor de datos que no es un valor atípico.

  • Muchos, si no la mayoría de los paquetes de software indican valores atípicos en un conjunto de datos mediante el uso de un asterisco (*) o símbolo de la estrella y utilizar el procedimiento descrito en el Paso 6 para identificar los valores atípicos. Sin embargo, no todos los paquetes usan estos símbolos y procedimientos- comprobar para ver lo que hace su paquete antes de analizar sus datos con un diagrama de caja.

    Diagrama de caja de mejores edades actriz (1928-2009- & lt; i & gt; n & lt; / i & gt; = 83 actrices) “/ & gt;. & Lt; / p & gt; & lt; div class =Diagrama de caja de las mejores edades actriz (1928-2009- norte = 83 actrices).

    Un diagrama de caja horizontal para las edades de la mejor actriz ganadores del Oscar de 1928-2009 se muestra en la figura anterior. Puede ver los números que separa las secciones del diagrama de caja que coincida con las estadísticas de resumen de cinco números que se muestran en la siguiente figura.

    Las estadísticas descriptivas para las edades Mejores actriz (1928-2009).
    Las estadísticas descriptivas para las edades Mejores actriz (1928-2009).

    Video: Gráfica de caja y bigote 1

    Diagramas de caja puede ser vertical (hacia arriba y hacia abajo) con los valores en el eje que va desde la parte inferior (la más baja) a arriba (la más alta) - o pueden ser horizontales, con los valores en el eje que va de izquierda (más baja) a la derecha (más alto ).

    Los pasos que se muestran aquí demuestran una forma de cálculo de la mediana y los cuartiles del resumen de cinco números y de construir el diagrama de caja. Pero hay varios otros métodos aceptables. No sea demasiado alarmado si su calculadora o un amigo le da un diagrama de caja cercana pero diferente de lo que estas medidas se daría.

    Artículos Relacionados