J'ai deux fichiers texte, l'un avec 100 000 chaînes et l'autre avec 1 000 chaînes, qui sont déjà présentes dans le fichier plus grand. Je voudrais soustraire ces 1 000 chaînes, de sorte que le fichier plus volumineux ne contienne alors que 99 000. Il ne s’agit pas de supprimer les doublons, mais plutôt de supprimer les chaînes.
Y a-t-il une commande pour le faire.
windows-xp
text-editors
george
la source
la source
Réponses:
Si les chaînes sont toutes sur des lignes séparées, vous pouvez utiliser grep de MSYS ou Cygwin comme suit:
le
-v
option inverse la correspondance de sorte que la sortie est toutes les ligneshundred000line.txt
qui ne correspond à aucune lignethousandLine.txt
. Voir le manuel de grep pour plus d'informations.la source