J'ai beaucoup cherché, mais il n'est écrit nulle part comment supprimer les caractères non ASCII de Notepad ++.
J'ai besoin de savoir quelle commande écrire dans rechercher et remplacer (avec une image, ce serait génial).
Si je veux créer une liste blanche et mettre en signet tous les mots / lignes ASCII afin que les lignes non ASCII ne soient pas marquées
Si le fichier est assez volumineux et ne peut pas sélectionner toutes les lignes ASCII et que vous souhaitez simplement sélectionner les lignes contenant des caractères non ASCII ...
Encoding->Encode in ANSI
. N'a rien pu trouver autrement.Dans Notepad ++, si vous allez dans le menu Recherche → Rechercher des caractères dans la plage → Caractères non-ASCII (128-255), vous pouvez alors parcourir le document jusqu'à chaque caractère non-ASCII.
Assurez-vous de cocher « Wrap around » si vous souhaitez effectuer une boucle dans le document pour tous les caractères non ASCII.
la source
En plus de la réponse de ProGM, si vous voyez des caractères dans des cases comme NUL ou ACK et que vous voulez vous en débarrasser, ce sont des caractères de contrôle ASCII (0 à 31), vous pouvez les trouver avec l'expression suivante et les supprimer:
Afin de supprimer tous les caractères de contrôle non-ASCII ET ASCII, vous devez supprimer tous les caractères correspondant à cette expression régulière:
la source
\x00
et\x1F
sont déjà mises en correspondance dans la réponse par ProGM.mgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
Pour supprimer tous les caractères non ASCII, vous pouvez utiliser le remplacement suivant:
[^\x00-\x7F]+
Pour mettre en évidence les caractères, je recommande d'utiliser la fonction Marquer dans la fenêtre de recherche: cela met en évidence les caractères non-ASCII et mettre un signet dans les lignes contenant l'un d'entre eux
Si vous souhaitez mettre en évidence et mettre un signet sur les caractères ASCII à la place, vous pouvez utiliser l'expression régulière
[\x00-\x7F]
pour le faire.À votre santé
la source
Pour conserver de nouvelles lignes:
Prochain:
Maintenant, sélectionnez l'option Remplacer étendue et remplacez # par \ n
:) maintenant, vous avez un fichier ASCII propre;)
la source
Une autre bonne astuce consiste à passer en mode UTF8 dans votre éditeur afin que vous puissiez réellement voir ces personnages amusants et les supprimer vous-même.
la source
Autrement...
C'est bien si vous ne vous souvenez pas de l'expression régulière ou que vous ne vous souciez pas de la rechercher. Mais le regex mentionné par d'autres est également une bonne solution.
la source