Renvoyez un RDD contenant toutes les paires d'éléments avec des clés correspondantes en soi et dans l'autre.

x = sc.parallelize([("a", 1), ("b", 4)])
y = sc.parallelize([("a", 2), ("a", 3)])
sorted(x.join(y).collect())
# [('a', (1, 2)), ('a', (1, 3))]
Ethercourt.ml