J'ai un très long fichier texte (d' ici ) qui devrait contenir 6 caractères hexadécimaux puis un 'break' (qui apparaît comme un caractère et ne semble pas apparaître correctement dans le code Markdown ci-dessous) suivi de quelques mots:
00107B Cisco Systems, Inc
00906D Cisco Systems, Inc
0090BF Cisco Systems, Inc
5080 Cisco Systems, Inc
0E+00 ASUSTek COMPUTER INC.
000C6E ASUSTek COMPUTER INC.
001BFC ASUSTek COMPUTER INC.
001E8C ASUSTek COMPUTER INC.
0015F2 ASUSTek COMPUTER INC.
2354 ASUSTek COMPUTER INC.
001FC6 ASUSTek COMPUTER INC.
60182E ShenZhen Protruly Electronic Ltd co.
F4CFE2 Cisco Systems, Inc
501CBF Cisco Systems, Inc
J'ai fait quelques recherches et je ne vois rien qui pourrait fonctionner dans cette situation. Ma question est, comment puis-je utiliser grep
/ sed
/ awk
/ perl
pour supprimer toutes les lignes de ce fichier texte qui ne commencent pas avec exactement 6 caractères hexadécimaux et ensuite un 'break'?
PS Pour les points bonus, quelle est la meilleure façon de trier le fichier par ordre alphabétique et numérique selon les caractères hexadécimaux (ie 000000
-> FFFFFF
)? Dois-je simplement utiliser sort
?
Et pour être complet, vous pouvez aussi le faire avec grep:
Cette expression grep étendue recherche exactement 6 chiffres hexadécimaux au début de chaque ligne, suivie immédiatement par une frontière non-espace-à-espace (
\b
).la source