J'écris un programme de comptage de mots MapReduce en python. Le problème est qu'il y a beaucoup de caractères non alphabétiques éparpillés dans les données, j'ai trouvé ce post Supprimant tout sauf les caractères alphanumériques d'une chaîne en Python qui montre une belle solution utilisant...