Comment utiliser grep pour rechercher une ligne avec l'un des deux mots mais pas les deux?
11
Je veux rechercher des lignes avec 'word1' XOR 'word2' dans un fichier texte. Il devrait donc produire des lignes avec word1, word2 mais pas les lignes avec ces deux mots. Je voulais utiliser le XOR mais je ne sais pas comment l'écrire en ligne de commande Linux.
grep 'word1\|word2' text.txtrecherche les lignes contenant word1ou word2. Cela inclut les lignes qui contiennent les deux.
grep word1 text.txt | grep word2recherche les lignes contenant word1et word2. Les deux mots peuvent se chevaucher (par exemple foobarcontient fooet ob). Une autre façon de rechercher des lignes contenant les deux mots, mais uniquement de manière non superposée, est de les rechercher dans l'un ou l'autre ordre:grep 'word1.*word2\|word2.*word1' text.txt
grep word1 text.txt | grep -v word2recherche les lignes contenant word1mais pas word2. L' -voption indique à grep de conserver les lignes non correspondantes et de supprimer les lignes correspondantes, au lieu de l'inverse. Cela vous donne la moitié des résultats souhaités. En ajoutant la recherche symétrique, vous obtenez toutes les lignes contenant exactement l'un des mots.
Vous pouvez également commencer à partir des lignes contenant l'un ou l'autre des mots et supprimer les lignes contenant les deux mots. Étant donné les blocs de construction ci-dessus, c'est facile si les mots ne se chevauchent pas.
Merci c'est exactement ce que je cherchais. Les autres réponses sont également très intéressantes, alors regardez-les mal. Merci à tous pour votre contribution.
Si vous voulez considérer des mots entiers seulement (qu'il n'y a ni , fooni bardans foobarou barbarpar exemple), vous aurez besoin de décider comment ces mots sont délimités. Si c'est par n'importe quel caractère autre que des lettres, des chiffres et des traits de soulignement comme le fait l' -woption de nombreuses grepimplémentations, alors vous les changeriez en:
Car sedcela devient un peu compliqué à moins que vous n'ayez une sedimplémentation comme GNU sed qui supporte \</ \>comme les limites de mots comme GNU awk.
Désolé, je n'ai commencé la ligne de commande qu'il y a quelques semaines. Comment pourrais-je le forcer à rechercher uniquement des mots? J'ai essayé -Pw et -wP mais cela m'a donné la mauvaise sortie. J'ai également essayé d'utiliser '' entre * mot1 / * mot2 et autour de mot1 / mot2.
Lukali
@Lukali, voir modifier.
Stéphane Chazelas
2
Une solution bash:
#!/bin/bash
while (( $# )); do
a=0 ; [[ $1 =~ foo ]] && a=1
b=0 ; [[ $1 =~ bar ]] && b=1
(( a ^ b )) && echo "$1"
shift
done
Pour le tester:
$ ./script {foo,bar}\ {foo,bar} neither
foo foo
bar bar
Avec GNU
awk
:Ou portable:
Avec un
grep
support pour-P
(PCRE):Avec
sed
:Si vous voulez considérer des mots entiers seulement (qu'il n'y a ni ,
foo
nibar
dansfoobar
oubarbar
par exemple), vous aurez besoin de décider comment ces mots sont délimités. Si c'est par n'importe quel caractère autre que des lettres, des chiffres et des traits de soulignement comme le fait l'-w
option de nombreusesgrep
implémentations, alors vous les changeriez en:Car
sed
cela devient un peu compliqué à moins que vous n'ayez unesed
implémentation comme GNUsed
qui supporte\<
/\>
comme les limites de mots comme GNUawk
.la source
Une solution bash:
Pour le tester:
la source