Cómo delinear los datos de prueba y ensayo para el análisis predictivo

Video: Prueba de Hipótesis para la media

Cuando los datos están listos y que está a punto de comenzar a construir su modelo predictivo para el análisis, es útil para delinear su metodología de prueba y elaborar un plan de pruebas. La prueba debe ser impulsada por los objetivos de negocio que ha reunido, documentado, y se recoge toda la información necesaria para ayudarle a alcanzar.

Video: Ensayo metalografico

De buenas a primeras, se debe diseñar un método para probar si un objetivo de negocio se ha alcanzado con éxito. Desde el análisis predictivo miden la probabilidad de un resultado futuro - y la única manera de estar listo para realizar una prueba de este tipo es mediante la capacitación de su modelo en los datos del pasado, que todavía tiene que ver lo que puede hacer cuando se está en contra de los datos futuros.

Por supuesto, no se puede correr el riesgo de ejecución de un modelo no probada en datos reales futuros, por lo que tendrá que utilizar los datos existentes para simular de forma realista los datos futuros. Para ello, hay que dividir los datos que está trabajando en la formación y prueba de datos.

Video: Instrucciones para hacer el ensayo CBR

Asegúrese de que selecciona estos dos conjuntos de datos al azar, y que ambos conjuntos de datos contienen y cubren todos los parámetros de datos que está midiendo.

Al dividir los datos en la prueba y de formación conjuntos de datos, que está evitando eficazmente cualquier problema sobreajuste que podrían derivarse de sobreentrenamiento el modelo en todo el conjunto de datos y recogiendo todos los patrones de ruido o características específicas que sólo pertenecen al conjunto de datos de la muestra y no son aplicable a otros conjuntos de datos.

La separación de sus datos en los conjuntos de datos de entrenamiento y prueba, alrededor del 70 por ciento y 30 por ciento respectivamente, asegura una medición precisa del rendimiento del modelo de análisis predictivo que estamos construyendo. Que desea evaluar su modelo frente a los datos de prueba, porque es una forma sencilla de medir si las predicciones del modelo son exactos.

Artículos Relacionados