“pyspark groupby plusieurs colonnes” Réponses codées

dataframe groupby plusieurs colonnes

grouped_multiple = df.groupby(['Team', 'Pos']).agg({'Age': ['mean', 'min', 'max']})
grouped_multiple.columns = ['age_mean', 'age_min', 'age_max']
grouped_multiple = grouped_multiple.reset_index()
print(grouped_multiple)
Unsightly Unicorn

groupe pyspark par et moyen dans les dataframes

df.groupBy("Profession").agg({'Age':'avg', 'Gender':'count'}).show()
Fine Falcon

pyspark groupby plusieurs colonnes

df.groupBy("year", "sex")
Plif Plouf

Réponses similaires à “pyspark groupby plusieurs colonnes”

Questions similaires à “pyspark groupby plusieurs colonnes”

Plus de réponses similaires à “pyspark groupby plusieurs colonnes” dans Python

Parcourir les réponses de code populaires par langue

Parcourir d'autres langages de code