J'utilise pyspark (Python 2.7.9 / Spark 1.3.1) et j'ai un Dataframe GroupObject dont j'ai besoin pour filtrer et trier dans l'ordre décroissant. Essayer d'y parvenir via ce morceau de code.
group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False)
Mais cela génère l'erreur suivante.
sort() got an unexpected keyword argument 'ascending'
Dans pyspark 2.4.4
1) group_by_dataframe.count().filter("`count` >= 10").orderBy('count', ascending=False) 2) from pyspark.sql.functions import desc group_by_dataframe.count().filter("`count` >= 10").orderBy('count').sort(desc('count'))
Pas besoin d'importer en 1) et 1) est court et facile à lire,
donc je préfère 1) à 2)
la source
vous pouvez utiliser groupBy et orderBy comme suit également
dataFrameWay = df.groupBy("firstName").count().withColumnRenamed("count","distinct_name").sort(desc("count"))
la source