3 tipos de aprendizaje automático

Video: Tipos de estrategias de aprendizaje

El aprendizaje automático viene en muchos sabores diferentes, dependiendo del algoritmo y sus objetivos. Se puede dividir máquina de algoritmos de aprendizaje en tres grupos principales en función de su finalidad:

Aprendizaje supervisado
aprendizaje no supervisado
Aprendizaje reforzado

Aprendizaje supervisado

Aprendizaje supervisado se produce cuando un algoritmo aprende de datos de ejemplo y las respuestas de destino asociados que pueden consistir en valores numéricos o etiquetas de cuerda, tales como clases o etiquetas, con el fin de predecir después la respuesta correcta cuando planteado con nuevos ejemplos. El enfoque supervisado es de hecho similar al aprendizaje humano bajo la supervisión de un profesor. El profesor proporciona un buen ejemplo para el estudiante a memorizar, y el estudiante se deriva reglas generales de estos ejemplos específicos.

Video: Estilos de Aprendizaje: LOS VISUALES

Es necesario distinguir entre los problemas de regresión, cuyo objetivo es un valor numérico, y problemas de clasificación, cuyo destino es una variable cualitativa, como una clase o una etiqueta. Una tarea de regresión determina los precios promedio de las casas en el área de Boston, y unas tareas de clasificación distingue entre tipos de flores de iris en base a sus medidas de sépalos y pétalos.

aprendizaje no supervisado

aprendizaje no supervisado se produce cuando un algoritmo aprende de ejemplos de fricción sin ninguna respuesta asociada, dejando al algoritmo para determinar los patrones de datos en su propio. Este tipo de algoritmo tiende a reestructurar los datos en otra cosa, como las nuevas características que pueden representar una clase o una nueva serie de valores no correlacionados. Son muy útiles para proporcionar los seres humanos con conocimientos sobre el significado de los datos y nuevos insumos útiles a los algoritmos de aprendizaje automático supervisado.

Como una especie de aprendizaje, que se asemeja a los métodos de los seres humanos usan para darse cuenta de que ciertos objetos o eventos son de la misma clase, como por ejemplo, observando el grado de similitud entre los objetos. Algunos sistemas de recomendación que se encuentran en la web en forma de automatización de marketing se basan en este tipo de aprendizaje.

El algoritmo de automatización de marketing deriva sus sugerencias de lo que has comprado en el pasado. Las recomendaciones se basan en una estimación de qué grupo de clientes a los que más se parece y luego inferir las preferencias probables en base a ese grupo.

Aprendizaje reforzado

Aprendizaje reforzado ocurre cuando se presente el algoritmo con ejemplos que carecen de etiquetas, como en el aprendizaje no supervisado. Sin embargo, se puede acompañar con un ejemplo de retroalimentación positiva o negativa según la solución propone el algoritmo. aprendizaje por refuerzo está conectado a aplicaciones para las que el algoritmo debe tomar decisiones (por lo que el producto es preceptivo, no sólo descriptiva, como en el aprendizaje no supervisado), y las decisiones tienen consecuencias. En el mundo humano, es como aprender por ensayo y error.

Los errores le ayudan a aprender porque tienen una penalidad sumada (costo, pérdida de tiempo, pesar, dolor, etc.), que la enseñanza de que un determinado curso de acción es menos probable que tenga éxito que otros. Un ejemplo interesante de aprendizaje por refuerzo se produce cuando los equipos aprenden a jugar juegos de video por sí mismos.

En este caso, una aplicación presenta el algoritmo de ejemplos de situaciones específicas, tales como tener el jugador atrapado en un laberinto evitando al mismo tiempo un enemigo. La aplicación permite que el algoritmo de conocer el resultado de las acciones que toma, y el aprendizaje se produce al tratar de evitar lo que se descubre a ser peligroso y de procurar la supervivencia. Puede echar un vistazo a cómo ha creado la empresa Google DeepMind una programa de aprendizaje por refuerzo que juega viejos videojuegos de Atari. Al ver el video, notar cómo el programa está inicialmente torpe y no calificada sino que mejora de manera constante con el entrenamiento hasta que se convierte en un campeón.