Existe-t-il un outil en ligne de commande pour rechercher du texte dans un fichier docx? J'ai essayé grep
, mais cela ne fonctionne pas avec docx même s'il fonctionne bien avec les fichiers txt et xml. Je pourrais d'abord convertir le docx en txt, mais je préférerais un outil qui fonctionne directement sur les fichiers docx. J'ai besoin de l'outil pour travailler sous Cygwin.
OP edit: Plus tard, j'ai découvert que le moyen le plus simple de réaliser le grep est en fait de convertir ces docx en txt puis de les grep.
grep
search
cygwin
microsoft-word
Gob00st
la source
la source
Réponses:
Je connais plusieurs outils d'indexation qui prennent en charge les documents Word. Ces outils vous permettent d'indexer des documents, puis de rechercher efficacement des mots dans l'index. Ils ne permettent pas les recherches en texte intégral.
la source
DOCx est compressé et ce n'est pas un format texte. Il vous faut donc d'abord un convertisseur . Après cela, vous pouvez utiliser la
find
commande sur le ou les fichiers convertis.la source
grep
?Avez-vous regardé le ninja openoffice ?
(je ne sais pas sur le support cygwin)
la source