J'ai un dataframe comme celui-ci:
cluster org time
1 a 8
1 a 6
2 h 34
1 c 23
2 d 74
3 w 6
Je voudrais calculer le temps moyen par organisation par cluster.
Résultat attendu:
cluster mean(time)
1 15 ((8+6)/2+23)/2
2 54 (74+34)/2
3 6
Je ne sais pas comment le faire dans Pandas, quelqu'un peut-il m'aider?
df.groupby(['org','cluster']).mean()
? ce n'est pas si significatif pour votre jeu de données que ceci:df.groupby(['cluster','org']).mean()
Réponses:
Si vous voulez d'abord prendre la moyenne de la combinaison de
['cluster', 'org']
, puis prendre la moyenne descluster
groupes, vous pouvez utiliser:Si vous voulez
cluster
uniquement la moyenne des groupes, vous pouvez utiliser:Vous pouvez également utiliser
groupby
le['cluster', 'org']
puis utilisezmean()
:la source
Je ferais simplement ceci, ce qui suit littéralement la logique souhaitée:
la source