Trame de données:
c_os_family_ss c_os_major_is l_customer_id_i
0 Windows 7 90418
1 Windows 7 90418
2 Windows 7 90418
Code:
print df
for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)):
print name
print group
J'essaye juste de boucler sur les données agrégées, mais j'obtiens l'erreur:
ValueError: trop de valeurs à décompresser
@EdChum, voici le résultat attendu:
c_os_family_ss \
l_customer_id_i
131572 Windows 7,Windows 7,Windows 7,Windows 7,Window...
135467 Windows 7,Windows 7,Windows 7,Windows 7,Window...
c_os_major_is
l_customer_id_i
131572 ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,...
135467 ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,...
La sortie n'est pas le problème, je souhaite boucler sur chaque groupe.
group
utilisantfor row, data in group.iterrows()
!Vous pouvez parcourir les valeurs d'index si votre dataframe a déjà été créée.
la source