¿Cómo decidir si desea mantener los valores atípicos en el análisis predictivo

Video: Determinacion de valores atipicos de una muestra de datos

La decisión de incluir valores atípicos en el análisis - o excluirlos - tendrá implicaciones para su modelo de análisis predictivo. Mantener los valores atípicos, como parte de los datos de su análisis puede conducir a un modelo que no es aplicable - ya sea a los valores atípicos o para el resto de los datos.

Video: Box Plot - valores atípicos

Si decide mantener un valor atípico, tendrá que elegir las técnicas y métodos estadísticos que tienen éxito en el manejo de los valores extremos sin influir en el análisis. Una de estas técnicas es el uso de funciones matemáticas tales como algoritmos naturales y raíz cuadrada para reducir la brecha entre los valores atípicos y el resto de los datos.

Estas funciones, sin embargo, sólo funcionan para datos numéricos que es mayor que cero - y pueden surgir otros problemas. Por ejemplo, la transformación de los datos puede requerir interpretaciones de la relación entre las variables en los datos recién transformadas que difieren de la interpretación que gobierna las variables en los datos originales.

La mera presencia de valores atípicos en los datos puede ayudar a comprender su negocio que pueden ser muy útiles en la generación de un modelo sólido. Los valores atípicos pueden llamar la atención sobre un modelo de negocio válido que ilustra un acontecimiento significativo poco inusual.

En busca de valores atípicos, la identificación de ellos, y evaluar su impacto debería ser parte del análisis de datos y procesamiento previo. expertos en el dominio de negocio pueden proporcionar información y ayudar a decidir qué hacer con los casos inusuales en su análisis. Aunque a veces el sentido común es todo lo que necesita para hacer frente a los valores extremos, a menudo es útil preguntar a alguien que conoce las cuerdas.

Video: Detección de valores atípicos

Si estás en un negocio que se beneficia de eventos raros - por ejemplo, un observatorio astronómico con una beca para estudiar asteroides que cruzan la órbita de la Tierra - que está más interesado en los valores extremos que en la mayor parte de los datos.

Los valores extremos pueden ser una gran fuente de información. Desviarse de la norma podría ser una señal de actividad sospechosa, noticias de última hora, o un evento oportunista o catastrófica. Puede que tenga que desarrollar modelos que ayudan a identificar los valores atípicos y asnos los riesgos que significan.

Video: Estadistica 02 SECUNDARIA (4ºESO) matematicas intervalos

Es prudente realizar dos análisis: uno que incluye los valores extremos, y otra que los omite. A continuación, examinar las diferencias, tratar de comprender las implicaciones de cada método, y evaluar cómo la adopción de un método sobre el otro influiría en sus objetivos de negocio.

Artículos Relacionados