Renvoyez un nouveau RDD en appliquant une fonction à chaque élément de ce RDD.

rdd = sc.parallelize(["b", "b", "c"])
sorted(rdd.map(lambda x: (x, 1)).collect())
# [('a', 1), ('b', 1), ('c', 1)]
Ethercourt.ml