Tratando el enfoque de simulación en el análisis estadístico

software estadístico moderna hace que sea fácil para usted para analizar sus datos en la mayoría de las situaciones que es probable encontrar (resumir y representar gráficamente los datos, el cálculo de los intervalos de confianza, ejecute las pruebas de significación comunes, hacer un análisis de regresión, y así sucesivamente). Pero en ocasiones es posible que encuentre un problema para el que no existe una solución pre-programado. Derivación de nuevas técnicas estadísticas puede implicar algo de matemáticas muy complicado, y por lo general sólo un estadístico teórico profesional intentos de hacerlo.

Pero hay una manera general y sin embargo simple y poderosa para obtener respuestas a muchas preguntas estadísticos, incluso si usted no es un genio de las matemáticas. Se llama simulación, o el Monte Carlo técnica.

La estadística es el estudio de las fluctuaciones aleatorias, y la mayoría de los problemas estadísticos realmente se reducen a la pregunta “¿Qué están haciendo las fluctuaciones aleatorias?” Pues bien, resulta que los ordenadores son muy bueno en el dibujo números aleatorios de una variedad de distribuciones. Con el software adecuado, se puede programar un ordenador para realizar las fluctuaciones aleatorias que encarnan el problema que estamos tratando de solve- continuación, sólo tiene que ver lo que hicieron esas fluctuaciones. A continuación, puede volver a ejecutar este proceso muchas veces y resumir lo que sucedió en el largo plazo.

El enfoque de simulación se puede utilizar para resolver los problemas de la teoría de probabilidades, determinar la significación estadística en situaciones comunes o poco comunes, calcular la potencia de un estudio propuesto, y mucho más. Aquí es un simple, aunque algo artificial, ejemplo de lo que puede hacer la simulación:

¿Cuál es la probabilidad de que el producto de los CI de dos personas elegidas al azar es mayor que 12.000?

Video: Analisis Estadistico De Datos Con SPSS

CI se distribuyen normalmente, con una media de 100 y una desviación estándar de 15. (Y no preguntan por qué alguien querría para multiplicar dos puntuaciones de CI juntos- es sólo un ejemplo!)

Tan simple como esta pregunta puede sonar, es un problema muy difícil de resolver con exactitud, y que tendría que ser un experto matemático para siquiera intentarlo. Pero es muy fácil de obtener una respuesta por simulación. Sólo hacer esto:

Video: UCAM - MiríadaX - Curso Aprende análisis estadístico de datos con R. Profesor Jorge López

  1. Generar dos números de CI aleatorio (normalmente distribuido, m = 100, SD = 15).

  2. Multiplicar los dos números de CI juntos.

  3. Ver si el producto es superior a 12.000.

  4. Repita los pasos 1-3 de un millón de veces y contar cuántas veces excede el producto de 12.000.

    Video: Transformación y Analisis estadistico descriptivo con SPSS

  5. Divida ese recuento por millón, y que tenga su probabilidad.

Esta simulación se puede configurar utilizando el programa gratuito Estadísticas 101 o incluso Excel. El uso de software R, los cinco pasos pueden ser programados en una sola línea:

sum (rnorm (1000000,100,15) * rnorm (1000000,100,15) gt; 12.000) / 1000000

Incluso si usted no está familiarizado con la sintaxis de R, es probable que pueda coger la deriva de lo que este programa está haciendo.

  • Cada función “rnorm” genera un millón de azar puntuaciones de CI.

  • El “*” los multiplica juntos por parejas.

  • El “gt;”, compara cada uno de un millón de productos a 12.000.

  • La función de “suma” se suma el número de veces que la comparación resulta verdadero (cierto cuenta como 1- falso cuenta como 0).

  • El “/” divide la suma por un millón.

R imprime los resultados de los programas de “una sola línea” como ésta sin tener que indicar explícitamente que lo haga. Cuando una persona corrió este programa en su ordenador de sobremesa, se calcula por alrededor de medio segundo y luego se imprime el resultado: 0,172046. Luego corrió otra vez, y se imprime 0.172341. Esa es una característica de los métodos de simulación - que dan resultados ligeramente diferentes cada vez que las ejecuta. Y las simulaciones más corras, más precisos serán los resultados. Es por eso que los pasos anteriores piden un millón de repeticiones. Usted no recibirá una respuesta exacta, pero usted sabrá que la probabilidad es de alrededor de 0.172, que es lo suficientemente cerca.

Artículos Relacionados