Cómo mirar a los márgenes de datos y proporciones en r

En el análisis de datos categóricos, muchas técnicas R utilizan el totales marginales de la tabla en los cálculos. Los totales marginales son el recuento total de los casos más de las categorías de interés. Por ejemplo, los totales marginales para el comportamiento serían la suma sobre las filas de la tabla trial.table.

Cómo añadir márgenes a la mesa

R le permite extender una tabla con los totales marginales de las filas y columnas en un simple comando. Para ello, se utiliza el addmargins () función, así:

gt; addmargins (trial.table) Sumrisk sano enfermo 349 43no_risk 11 32 43Sum45 41 86

También se pueden añadir los márgenes de una sola dimensión especificando el margen argumento a favor de la addmargins () función. Por ejemplo, para obtener sólo los recuentos marginales para el comportamiento, haga lo siguiente:

gt; addmargins (trial.table, el margen = 2) enfermo sano Sumrisk 349 43no_risk 11 32 43

los margen argumento toma un número o un vector de números, pero puede ser un poco confuso. Los márgenes se numeran de la misma manera como en el aplicar() función. Asi que 1 es sinónimo de filas y 2 para las columnas. Para añadir el margen de la columna, es necesario establecer margen a 2, pero este margen columna contiene los totales de las filas.

Video: Intervalo de confianza para una diferencia de proporciones 1

Cómo calcular las proporciones

Puede convertir una tabla con un recuento de una mesa con proporciones muy fácilmente usando el prop.table () función. Esto también funciona para tablas de múltiples vías. Si desea conocer las proporciones de observaciones en cada célula de la tabla con el número total de casos, sólo tiene que hacer lo siguiente:

gt; prop.table (trial.table) healthyrisk enfermo 0,3953488 0,1279070 0,3720930 0.1046512no_risk

Esto le indica que, por ejemplo, el 10,4 por ciento de las personas en el estudio eran sanos, incluso cuando mostraron comportamientos de riesgo.

Cómo calcular las proporciones más columnas y filas

Pero lo que si desea saber qué fracción de las personas con comportamiento de riesgo se enfermó? Entonces usted no tiene que calcular las proporciones dividiendo los recuentos por el número total de casos para toda la dataset- lugar, se divide el recuento de los totales marginales.

R le permite hacer esto muy fácilmente utilizando, de nuevo, el prop.table () función, pero esta vez especificando el margen argumento.

Video: Prueba de hipótesis para proporciones Ejemplo 2

Echar un vistazo a la mesa de nuevo. Desea calcular las proporciones más de cada fila, ya que cada fila representa una categoría de comportamiento. Por lo tanto, para obtener las proporciones correctas, se especifica margen = 1 Me gusta esto:

gt; prop.table (trial.table, el margen = 1) healthyrisk enfermo 0,7906977 0,2558140 0,7441860 0.2093023no_risk

En cada fila, las proporciones suman 1. Ahora se puede ver que el 79 por ciento de las personas que muestran el comportamiento de riesgo se enfermó. Bueno, no es una gran noticia que los comportamientos de riesgo puede causar enfermedades, y las proporciones que se muestran en el último punto de resultado en esa dirección.

Sin embargo, los científicos creen que sólo si se puede realizar copias de seguridad de una manera más objetiva. Ese es el punto en el que usted debe considerar hacer algunas pruebas estadísticas.

Artículos Relacionados