Modo de empleo aplicar para crear resúmenes tabulares en r

Tu usas tapply () para crear resúmenes tabulares de datos en R. Con tapply (), usted puede crear fácilmente los resúmenes de los subgrupos de datos. Esta función tiene tres argumentos:

  • x: Un vector

  • ÍNDICE: Un factor o lista de factores

  • DIVERTIDO: Una función

    Video: Como hacer un curriculum profesional (y muy bueno)

Por ejemplo, calcular la longitud sépalo media en el conjunto de datos iris:

gt; Tapply (iris $ Sepal.Length, iris $ Especies, quiere decir) setosa versicolor virginica5.006 5.936 6.588

Con este breve línea de código, lo hace un poco de materia de gran alcance. Usted le dice a R para tomar la Sepal.Length columna, dividirlo según Especies, y luego calcular la media para cada grupo.

Esta es una expresión importante para escribir código en R, y por lo general se conoce con el nombre de Split, en Aplicar y, Combine (SAC). En este caso, se divide un vector en grupos, aplicar una función a cada grupo, y luego combinar el resultado en un vector.

Por supuesto, el uso de la con() función, usted puede escribir su línea de código en una forma un poco más legible:

gt; con (iris, Tapply (Sepal.Length, Especie, significa)) setosa versicolor virginica5.006 5,936 6,588

Utilizando tapply (), también puede crear más tablas complejas para resumir los datos. Esto se hace mediante el uso de una lista como su ÍNDICE argumento.

Cómo utilizar tapply () para crear tablas de dimensiones superiores

Por ejemplo, tratar de resumir la trama de datos mtcars, una trama de datos integrada con datos sobre los motores de automóvil y rendimiento. Al igual que con cualquier objeto, puede utilizar str () para inspeccionar su estructura:

gt; str (mtcars)

La variable a.m es un vector numérico que indica si el motor tiene un automático (0) O manual (1) Caja de cambios. Porque esto no es muy descriptivo, empezar por crear un nuevo objeto, carros, que es una copia de mtcars, y cambiar la columna a.m siendo un factor:

Video: Método simplex ejemplo básico a mano, para maximizar [Simplex method to maximize]

gt; carros lt; - dentro de los (mtcars, + am lt; - factor de (am, niveles = 0: 1, etiquetas = C ("Automático", "Manual")) +)

ahora usa tapply () para encontrar los medios millas por galón (mpg) Para cada tipo de caja de cambios:

gt; (automóviles, con tapply (mpg, am, media)) automático Manual17.14737 24.39231

Sí, estás en lo correcto. Esto es todavía sólo una tabla unidimensional. Ahora, trata de hacer una tabla de dos dimensiones con el tipo de caja de cambios (a.m) y el número de engranajes (engranaje):

gt; (automóviles, con tapply (mpg, la lista (de engranajes, AM), la media)) automático Manual3 16.10667 21.05000 NA4 26.2755NA 21.380

Tu usas tapply () para crear resúmenes tabulares de datos. Esto es un poco similar a la mesa() función. Sin embargo, mesa() puede crear tablas de contingencia solamente (es decir, tablas de cuentas), mientras que con tapply () se puede especificar cualquier función que la función de agregación. En otras palabras, con tapply (), se puede calcular el recuento, medios, o cualquier otro valor.

Si desea resumir las estadísticas en un solo vector, tapply () es muy útil y rápido de usar.

Modo de empleo agregada ()

Otra de las funciones de I que hace algo muy similar es agregar():

Video: Cómo crear un índice (tabla de contenido) automático en Word 2010

gt; (automóviles, con agregado (mpg, la lista de engranajes (= marcha, am = am), media)) gearamx1 3 automático 16.106672 21.050003 4 Automática 4 Manual 5 Manual 26.275004 21.38000

A continuación, se toma agregar() a nuevas alturas utilizando el interfaz de fórmula.

Artículos Relacionados