Cómo utilizar el modelo de Markov en el análisis predictivo

los Modelo de Markov es un modelo estadístico que se puede utilizar en el análisis predictivo que se basa en gran medida en la teoría de probabilidades. (Es el nombre de un matemático ruso cuya investigación primaria estaba en la teoría de probabilidades.)

He aquí un escenario práctico que ilustra cómo funciona: Imagínese que desea predecir si el equipo X va a ganar el partido de mañana. El primero que hay que hacer es recoger estadísticas anteriores sobre el Team X. La pregunta que podría surgir es lo lejos que debe ir en la historia?

Vamos a suponer que fueron capaces de llegar a los últimos 10 resultados de los juegos anteriores en secuencia. ¿Quieres saber la probabilidad de que el equipo X de ganar el siguiente juego, dados los resultados de los últimos 10 juegos.

El problema es que mientras más atrás en la historia quiere ir, más difícil y más complejo el cálculo de recopilación de datos y probabilidad convertirse.

Lo creas o no, el modelo de Markov simplifica su vida que le proporciona la Markov Asunción, que se parece a esto cuando usted lo escribe en palabras:

La probabilidad de que un evento ocurra, dado norte eventos pasados, es aproximadamente igual a la probabilidad de que un evento que ocurrirá dada sólo el último evento pasado.

Escrito como una fórmula, la asunción de Markov se ve así:

De cualquier manera, la asunción de Markov significa que usted no necesita ir muy atrás en la historia para predecir el resultado de mañana. Usted sólo puede usar el más reciente evento pasado. Esto se llama el de primer orden de predicción de Markov porque usted está considerando solamente el último evento de predecir el futuro evento.

UN segundo orden de predicción Markov incluye sólo los últimos dos eventos que suceden en secuencia. De la ecuación acaba de dar, la siguiente ecuación ampliamente usado se puede derivar también:

Esta ecuación tiene como objetivo para calcular la probabilidad de que algunos eventos ocurrirán en secuencia: evento₁ después evento₂, y así. Esta probabilidad puede ser calculada multiplicando la probabilidad de cada evento_t (Dado el caso anterior a ella) por el siguiente evento en la secuencia. Por ejemplo, supongamos que desea para predecir la probabilidad de que el equipo X gana, pierde, y luego los lazos.

Así es como un modelo predictivo típico basado en un modelo de Markov funcionaría. Considere el mismo ejemplo: Supongamos que desea predecir los resultados de un partido de fútbol que se jugará por el Team X. Los tres resultados posibles - llamada estados - son la victoria, pérdida o empate.

Suponga que usted ha recogido los datos estadísticos anteriores sobre los resultados de los partidos de fútbol del equipo X, y que el equipo X perdió su juego más reciente. ¿Quieres predecir el resultado del próximo partido de fútbol. Todo es cuestión de adivinar si el equipo X va a ganar, perder o empatar - basándose únicamente en los datos de los juegos anteriores. Así que aquí es cómo se utiliza un modelo de Markov para hacer esa predicción.

Calcular algunas probabilidades basadas en datos del pasado.
Por ejemplo, ¿cuántas veces ha perdido el equipo X juegos? ¿Cuántas veces ha ganado el equipo X juegos? Por ejemplo, imagina si el equipo X ganó 6 juegos de cada diez juegos en total. Entonces, el equipo X ha ganado un 60 por ciento de las veces. En otras palabras, la probabilidad de ganar para el equipo X es 60 por ciento.
Calcular la probabilidad de una pérdida, y entonces la probabilidad de empate, de la misma manera.
Usar la ecuación probabilidad Naïve Bayes para calcular las probabilidades tales como los siguientes:
La probabilidad de que el equipo X va a ganar, dado que el equipo X perdió el último partido.
La probabilidad de que el equipo X perderá, dado que el equipo X ganó el último partido.
Calcular las probabilidades para cada estado (Win, pérdida o empate).
Suponiendo que el equipo juega sólo un partido por día, las probabilidades son las siguientes:
P (Win | Pérdida) es la probabilidad de que el equipo X ganará hoy en día, dado que perdió ayer.
P (Win | Tie) es la probabilidad de que el equipo X ganará hoy en día, dado que se ató ayer.
P (Win | Win) es la probabilidad de que el equipo X ganará hoy en día, dado que ganó ayer.
Usando las probabilidades calculadas, crear un gráfico.
Un círculo en este diagrama representa un posible estado de que el equipo X podría alcanzar en un momento dado (victoria, derrota, empate) - los números de las flechas representan las probabilidades de que el equipo X podría pasar de un estado a otro.

Por ejemplo, si el equipo X acaba de ganar el juego de hoy (su estado actual = victoria), la probabilidad de que el equipo va a ganar de nuevo es de 60 por ciento- la probabilidad de que van a perder el juego siguiente es el 20 por ciento (en cuyo caso` d pasar de la situación actual = ganar al estado futuro = pérdida).

Supongamos que usted quiere saber las posibilidades de que el equipo X va a ganar dos partidos seguidos y perder el tercero. Como se pueden imaginar, eso no es una predicción sencilla de hacer.

Sin embargo, usando la tabla recién creada y la asunción de Markov, se puede predecir fácilmente las posibilidades de que tal evento ocurra. Se empieza con el estado victoria, caminar por el estado de la victoria de nuevo, y registrar 60 por ciento- a continuación, se mueve al estado de pérdidas y récord de 20 por ciento.

Las posibilidades de que el equipo X va a ganar dos veces y perder el tercer partido convertido en fácil de calcular: 60 por ciento multiplicado por el 60 por ciento Tiempos 20 por ciento, que es el 60 por ciento del 60 por ciento * * 20 por ciento, lo que equivale a 72 por ciento.

¿Cuáles son las posibilidades de que el equipo X va a ganar, a continuación, corbata, y luego perder dos veces después de eso? La respuesta es 20 por ciento (que se mueve de un estado victoria para empatar estado) Tiempos 20 por ciento (pasando de lazo a la pérdida), Tiempos 35 por ciento (pasando de la pérdida de la pérdida) veces el 35 por ciento (pasando de la pérdida de pérdida). El resultado es un 49 por ciento.