La cantidad de propagación es allí en los datos?

Cuando se trabaja con grandes volúmenes de datos estadísticas, a identificar la propagación de un conjunto de datos del centro con varios diferentes medidas de resumen: varianza, desviación estándar, cuartiles, rango intercuartil (RIC).

Video: Propagación de Errores

Varianza es la desviación al cuadrado media entre los elementos del conjunto de datos y la media. Para una muestra de los datos, la varianza se calcula así:

dónde

  • xyo es el valor de un solo elemento en la muestra.

  • es la media de la muestra.

  • norte es el tamaño de la muestra.

La desviación estándar es la raíz cuadrada de la varianza. Para la mayoría de las aplicaciones, la desviación estándar es más cómodo de usar que la varianza como medida de dispersión. Esto se debe a la varianza se mide en al cuadrado unidades, mientras que la desviación estándar se mide en las mismas unidades que los datos. Por ejemplo, la varianza de un conjunto de datos que consta de precios se mide en dólares cuadrado, y la desviación estándar se mide en dólares. La desviación estándar es la medida más ampliamente utilizada de la propagación en un conjunto de datos.

Cuartiles dividen un conjunto de datos en cuatro partes iguales. El primer cuartil (Q1) Divide los datos en el 25 por ciento más bajo de las observaciones y la más alta 75 por ciento (25 por ciento de las observaciones se menos que Q1, y 75 por ciento son mas grande que Q1). El segundo cuartil (Q2) Divide los datos en el 50 por ciento más bajo de las observaciones y la más alta 50 por ciento. El tercer cuartil (Q3) Divide los datos en el 75 por ciento más bajo de las observaciones y la más alta 25 por ciento. El rango intercuartil (IQR) es igual a la diferencia entre el tercer y primer cuartiles:

El IQR representa el 50 por ciento de los datos.

Los cuartiles de un conjunto de datos se ilustran mejor con una diagrama de caja. La siguiente figura muestra un diagrama de caja de los retornos diarios a ExxonMobil en 2013.

diagrama de caja de los rendimientos diarios a ExxonMobil valores en 2013.
diagrama de caja de los rendimientos diarios a ExxonMobil valores en 2013.

El diagrama de caja muestra varias estadísticas clave de las declaraciones de ExxonMobil:

Video: 30 Curiosidades de High School Musical (1-2-3) | Cosas que quizás no sabías

El rendimiento mínimo se muestra en un gráfico como un único punto en la parte inferior de la trama (un cuadro de muestra de la trama valores atípicos como puntos individuales). Q1 se muestra como la parte inferior de la caja, Q2 es la línea de color negro sólido en el medio de la caja, y Q3 es la parte superior de la caja. El máximo rendimiento se muestra como un único punto en la parte superior de la trama.

Artículos Relacionados