Análisis exploratorio de datos cuantitativos (eda) técnicas

Aunque EDA se basa principalmente en las técnicas gráficas, que también consta de un par de técnicas cuantitativas. Este artículo aborda dos de ellos: la estimación del intervalo y la prueba de hipótesis.

la estimación del intervalo

la estimación del intervalo es una técnica que se utiliza para construir una distancia de los valores dentro de la cual es probable que caiga una variable. Un ejemplo importante de esto es el intervalo de confianza. UN intervalo de confianza es un intervalo de números que es probable que contenga el valor de una medida de la población, tales como la media. Un intervalo de confianza se construye como sigue:

El intervalo de confianza consiste en una límite inferior igual a la estimación puntual menos el margen de error, y una limite superior igual a la estimación puntual más el margen de error.

los punto estimado es un único valor estimado de una muestra. Por ejemplo, la media de la muestra es una estimación puntual de la media poblacional. Del mismo modo, la desviación estándar de la muestra es una estimación puntual de la desviación estándar de la población.

El margen de error refleja la cantidad de incertidumbre asociada a la estimación puntual. En otras palabras, se muestra la cantidad de la estimación puntual puede cambiar de una muestra a la siguiente. El margen de error se basa en la desviación estándar y el tamaño de la muestra que está siendo utilizado. El resultado de estos cálculos es una gama de valores que es probable que contenga el verdadero valor de la medida de la población.

Por ejemplo, supongamos que un investigador determina que con confianza del 95 por ciento, el intervalo (-2,0 por ciento, 8,0 por ciento) contiene el verdadero valor de la media vuelta a la S&P 500 el próximo año. La media de la muestra es la media del límite inferior y superior de este intervalo (es decir, 3,0 por ciento). El margen de error es, por tanto, 5 por ciento.

Evaluación de la hipótesis

UN hipótesis estadística es una declaración que se supone que es cierto a menos que haya una fuerte evidencia contradictoria. La prueba de hipótesis se utiliza ampliamente en muchas disciplinas para determinar si una proposición es verdadera o falsa. Por ejemplo, la prueba de hipótesis se podría utilizar para determinar si

  • La edad media de los residentes de un estado es de 43 años de edad.

  • La media vuelta a las acciones en una cartera es del 7,2 por ciento.

    Video: Técnicas de recolección y análisis de los datos en la investigación cuantitativa

  • La cantidad de lluvia anual en una ciudad sigue la distribución normal.

La prueba de hipótesis es un proceso multi-etapa que consiste de los siguientes:

  1. La declaración de la hipótesis nula: Esta es la afirmación de que se supone que es cierto.

  2. La declaración de la hipótesis alternativa: Esta es la declaración que será aceptado si se rechaza la hipótesis nula.

    Video: Análisis Univariante (URJCx)

  3. El nivel de significancia mínimo al que se llevará a cabo la prueba de hipótesis: Esto es igual a la probabilidad de rechazar la hipótesis nula cuando es falsa.

  4. La estadística de prueba: Se trata de una medida numérica que indica si los datos de la muestra es consistente con la hipótesis nula.

    Video: ANALISIS EXPLORATORIO DE DATOS

  5. El valor crítico: si la estadística de prueba es más extremo que el valor crítico, se rechaza la hipótesis nula.

  6. La decisión: Sobre la base de la relación entre la estadística de prueba y el valor crítico, se toma una decisión en cuanto a si o no la hipótesis nula debe ser rechazada.

Artículos Relacionados