Je veux calculer un résumé d'une variable dans un data.frame pour chaque combinaison unique de facteurs dans le data.frame. Dois-je utiliser plyr pour ce faire? Je suis d'accord avec l'utilisation de boucles au lieu d'appliquer (); il suffirait donc de découvrir chaque combinaison unique.
r
categorical-data
aggregation
plyr
russellpierce
la source
la source
Réponses:
Bien que je pense que
aggregate
c'est probablement la solution que vous cherchez, si vous voulez créer une liste explicite de toutes les combinaisons de facteurs possibles,expand.grid
cela fera pour vous. par exempleVous pouvez ensuite parcourir chaque ligne du bloc de données résultant pour extraire les enregistrements de vos données d'origine.
la source
Voir
aggregate
etby
. Par exemple, à partir du fichier d'aide pouraggregate
:la source
Voici la solution plyr, qui a l'avantage de renvoyer plusieurs statistiques récapitulatives et de produire une barre de progression pour les longs calculs:
la source
En plus d'autres suggestions, vous pouvez trouver la
describe.by()
fonction dans lepsych
package utile. Il peut être utilisé pour afficher des statistiques récapitulatives sur les variables numériques à travers les niveaux d'une variable de facteur.la source
Personnellement, j'aime
cast()
le package de remodelage en raison de sa simplicité:la source
Il
library(doBy)
y a aussi lasummaryBy()
fonction, par exemplela source