Questions marquées «text-processing»

9
Mélangez deux fichiers texte parallèles

J'ai deux corpus parallèles alignés sur des phrases (fichiers texte) avec environ 50 millions de mots. (du corpus Europarl -> traduction parallèle de documents juridiques). Je voudrais maintenant mélanger les lignes des deux fichiers, mais les deux de la même manière. Je voulais aborder cela en...

9
Gestion de 3 fichiers avec awk

Pensez aux fichiers suivants: file1: boo,8,1024 foo,7,2048 file2: foo,0,24,154 noo,0,10,561 file3: 24,154,7,1024,0 Ce dont j'ai besoin, c'est d'aller dans File1 et de vérifier si $2==7; si cela est vrai, prendre $1, $2et $3de Fichier1 ; maintenant je dois comparer si $1de Fichier1 égal à $1partir...

9
Comment grouper les lignes d'un fichier par deux?

J'ai un fichier texte comme celui-ci: a b c d e f g Comment puis-je regrouper ces lignes pour obtenir une sortie comme celle-ci: a-b b-c c-d d-e e-f f-g Je dois le faire en shell (sh, csh, bash). J'ai trouvé ceci: cat file | xargs -n2 mais le dernier élément du premier groupe n'est pas devenu le...

9
Comment remplacer un code multi-lignes par sed?

J'ai un gros fichier qui contient des caractères spéciaux. Il y a là un code multi-lignes que je veux remplacer sed. Cette: text = "\ ------ ------\n\n\ This message was automatically generated by email software\n\ The delivery of your message has not been affected.\n\n\ ------ ------\n\n" Doit se...

9
Grep mot dans un fichier puis copiez le fichier

J'ai une collection de fichiers (* .zip, * .txt, * .tar.gz, * .doc, ... etc). Ces fichiers résident dans un chemin. Je veux trouver tous les fichiers (* .txt), puis copier uniquement les fichiers texte contenant des mots spécifiques (par exemple LINUX / UNIX). J'ai couru ce qui suit: find . -name...

9
Une question sur awk

Ok, puisque c'est une question complexe, je vais l'expliquer clairement. J'ai obtenu un contenu de fichier comme indiqué ci-dessous: $ Cat File1 ABC Cool Lol POP {MNB} ABC Cool Lol POP {MNB} ABC Cool Lol POP {MNB} ABC Cool Lol POP {TBMKF} ABC Cool Lol POP {YUKER} ABC Cool Lol POP {EFEFVD} La sortie...

9
awk sed if, déclaration

J'essaye d'ajouter 0 au début, SI il y a un "." au 2e caractère de cette ligne. Je ne pouvais pas combiner ces deux; awk '{ print substr( $0, 2, 1 ) }' file.txt montrant le deuxième caractère sed -ie "s/.\{0\}/0/" file.txt en ajoutant un zéro au début. Il devrait y avoir un "si le deuxième...