Entrenamiento, validación y pruebas de aprendizaje de máquinas

Video: Nº 168: IA Aprendizaje - Entrenamiento y Validación Cruzada

En un mundo perfecto, se podría realizar una prueba en los datos que el algoritmo de aprendizaje automático nunca ha aprendido de antes. Sin embargo, a la espera de los datos frescos no siempre es factible en términos de tiempo y costes.

Como primer recurso sencillo, puede dividir aleatoriamente sus datos en conjuntos de entrenamiento y prueba. La división común es del 25 al 30 por ciento para las pruebas y los 75 a 70 por ciento restante para el entrenamiento. Dividir los datos que consiste en su respuesta y características, al mismo tiempo, mantener la correspondencia entre cada respuesta y sus características.

El segundo remedio se produce cuando se necesita para ajustar su algoritmo de aprendizaje. En este caso, los datos de prueba dividida no es una buena práctica porque es causa de otro tipo de sobreajuste denominado fisgoneo. Para superar espionaje, necesita una tercera división, llamado conjunto de validación. Una fracción sugerido es que sus ejemplos dividido en tres partes: 70 por ciento para la formación, el 20 por ciento para la validación, y 10 por ciento para las pruebas.

Video: José Supo - Prueba de Hipótesis y Estimación Puntual

Debe realizar la división al azar, es decir, sin tener en cuenta el orden inicial de los datos. De lo contrario, la prueba no será fiable, ya que el orden se puede causar sobreestimación (Cuando hay algún pedido significativa) o subestimación (Cuando la distribución difiere en exceso). Como solución, debe asegurarse de que la distribución de prueba no es muy diferente de la distribución de formación, y que se produce ordenación secuencial de los datos divididos.

Por ejemplo, comprobar si los números de identificación, cuando estén disponibles, son continuas en sus conjuntos. A veces, incluso si usted cumpla estrictamente por muestreo aleatorio, no siempre se puede obtener una distribución similar entre los grupos, sobre todo cuando su número de ejemplos es pequeño.

Cuando el número de ejemplos n es alta, como NGT; 10.000, puede crear un conjunto de datos con bastante seguridad dividida al azar. Cuando el conjunto de datos es menor, la comparación de las estadísticas básicas como la media, la moda, la mediana y la diferencia a través de la respuesta y características de los conjuntos de entrenamiento y prueba le ayudará a entender si el equipo de prueba no es adecuada. Cuando no está seguro de que la división es correcto, simplemente volver a calcular una nueva.