J'analyse un fichier de boîte aux lettres qui stocke les rapports du serveur de messagerie pour les courriers électroniques remis en échec. Je souhaite extraire les mauvaises adresses électroniques afin de les supprimer du système. Le fichier journal ressemble à ceci:
...some content...
The mail system
<[email protected]>: host mx1.hotmail.com[65.54.188.94] said: 550
Requested action not taken: mailbox unavailable (in reply to RCPT TO
command)
...some content...
The mail system
<[email protected]>: host viking.optimumpro.net[79.101.51.82] said: 550
Unknown user (in reply to RCPT TO command)
...some content...
The mail system
<[email protected]>: host mta5.am0.yahoodns.net[74.6.140.64] said: 554
delivery error: dd This user doesn't have a yahoo.com account
([email protected]) [0] - mta1172.mail.sk1.yahoo.com (in reply to end
of DATA command)
...etc.
L'adresse e-mail vient 2 lignes après une ligne avec "Le système de messagerie". Utiliser grep comme ceci me donne la ligne "Le système de messagerie" et les deux lignes suivantes:
grep -A 2 "The mail system" mbox_file
Cependant, je ne sais pas comment supprimer la ligne "Le système de messagerie" et la deuxième ligne vide de cette sortie. Je suppose que je pourrais écrire un script PHP / Perl / Python pour le faire, mais je me demande si cela est possible avec grep ou un autre outil standard. J'ai essayé de donner un décalage négatif au paramètre -B:
grep -A 2 -B -2 "The mail system" mbox_file
Mais grep se plaint:
grep: -2: invalid context length argument
Existe-t-il un moyen de faire cela avec grep?
Réponses:
Le moyen le plus simple de le résoudre en utilisant
grep
uniquement le procédé consiste à diriger un autre canal inverségrep
à la fin. Par exemple:la source
Si vous n'êtes pas obligé d'utiliser
grep
, essayezsed
...Lorsqu'il trouve une ligne contenant "Le système de messagerie", il lit la ligne suivante deux fois, via le
n;n;
, en supprimant chaque ligne précédente.Cela laisse la 3ème ligne de votre groupe dans l'espace du modèle, qui est ensuite imprimé via la
p
commande de sed . L'-n
option en tête empêche toute autre impression.Pour imprimer également les deux lignes suivantes, il suffit de passer à la suivante et d’imprimer
n;p
deux fois plus.Les lectures de ligne suivante pour les lignes dont vous avez besoin peuvent être cumulées et imprimées en un seul bloc avec un seul
p
...N
lit la ligne suivante et l'ajoute à l'espace du motif,Voici la version condensée finale ...
Si vous voulez un séparateur de groupe , similaire à ce que grep wouuld produira, vous pouvez utiliser la commande insert de sed
i
(qui doit être la dernière commande sur une ligne) ...Voici la syntaxe pour inclure un séparateur de groupe
Voici le résultat de la première correspondance:
la source
-B
est pour les lignes précédentes, donc pas besoin de donner une valeur négative.la source
-A 2 -B 2
imprime de deux lignes avant le contexte à deux lignes après le contexte. La question concerne l'impression de 2 lignes après le contexte à 4 lignes après le contexte.Je ne vois aucun intérêt à utiliser uniquement grep (s), sauf s'il s'agit d'une contrainte stricte. Cela ne peut pas être fait avec un seul appel à grep.
la source
Ceci imprime la 1 ligne suivante après le match regexp, en utilisant Perl
la source