Outil en ligne de commande pour rechercher des fichiers docx

9

Existe-t-il un outil en ligne de commande pour rechercher du texte dans un fichier docx? J'ai essayé grep, mais cela ne fonctionne pas avec docx même s'il fonctionne bien avec les fichiers txt et xml. Je pourrais d'abord convertir le docx en txt, mais je préférerais un outil qui fonctionne directement sur les fichiers docx. J'ai besoin de l'outil pour travailler sous Cygwin.

OP edit: Plus tard, j'ai découvert que le moyen le plus simple de réaliser le grep est en fait de convertir ces docx en txt puis de les grep.

Gob00st
la source
Réponse de stackoverflow associée .
jw013
Je me suis débarrassé de la partie DOS, car c'est hors sujet ici
Michael Mrozek
En relation: Indexation en texte intégral conviviale en ligne de commande?
Gilles 'SO- arrête d'être méchant'

Réponses:

3

Je connais plusieurs outils d'indexation qui prennent en charge les documents Word. Ces outils vous permettent d'indexer des documents, puis de rechercher efficacement des mots dans l'index. Ils ne permettent pas les recherches en texte intégral.

Gilles 'SO- arrête d'être méchant'
la source
1

DOCx est compressé et ce n'est pas un format texte. Il vous faut donc d'abord un convertisseur . Après cela, vous pouvez utiliser la findcommande sur le ou les fichiers convertis.

Nils
la source
Ou vous pouvez utiliser un outil de recherche qui peut lire à l'intérieur des fichiers compressés. Dans votre dernière phrase, je suppose que vous vouliez dire grep?
Gilles 'SO- arrête d'être méchant'
@Gilles - regardez le titre original de la question avant que Michael ne la modifie. Cela semblait être une question sur DOS (et je l'ai signalé hors sujet).
Nils