J'ai un grand fichier texte dont une partie ressemble à ceci (valeurs modifiées):
JULIANA XXXX006060 LI1033322 THC BRL 730.00
XXXX006296 AA1004737 THC BRL 1,740.00
SANTOS JULIANA XXXX006668 AA1004786 THC BRL 8,150.00
SANTOS JULIANA CABINDA XXXX006697 AA1004777 THC BRL 2,325.00
SANTOS JULIANA XXXX006699 AA1004790 THC BRL 2,325.00
JULIANA BATA XXXX006141 CCC012946 THC BRL 1,460.00
JULIANA BATA XXXX006153 CCC013054 THC BRL 870.00
JULIANA XXXX006269 CCC013105 THC BRL 870.00
JULIANA XXXX006295 CCC013083 THC BRL 870.00
JULIANA BATA XXXX006305 CCC013043 THC BRL 1,460.00
Je veux toujours saisir (avec un cut
ou awk
ou quelque chose d'autre) la chaîne qui commence par XXXX00
, mais ce n'est jamais dans le même numéro de champ.
Comment puis-je faire cela dans un shell-script?
shell-script
text-processing
Vitor Gatti
la source
la source
-E
option (bien qu'elle ne nuise pas).Il semble que vous vouliez le 5ème champ à droite, donc
la source
Utilisation
grep
avec PCRE:Vous pouvez vous en tirer avec
-w
(mot) dans ce cas, notez que les caractères constitutifs du mot sont considérés comme[[:alnum:]_]
:la source
Quelques autres façons
Avec GNU
awk
Avec les anciennes versions de GNU
awk
, cela--re-interval
pourrait être nécessaire, doncAvec
tr
etgrep
la source
il semble que le nombre de champs soit différent parce que vous avez une liste de personnes là-bas, et ils ont différents nombres de noms. mais probablement aucun d'entre eux n'a un nom avec 0, donc coupez complètement jusqu'à la première chaîne délimitée par des espaces avec un dedans, enregistrez-le et coupez tout ce qui suit.
la source