Il se trouve que j’ai une grande collection de livres électroniques, qui sont des PDF et DjVus (avec calque de texte). J'aimerais pouvoir "rechercher" le contenu de mes livres numériques à la recherche d'expressions. Après avoir passé un peu de temps à chercher le problème sur Google, je n’ai trouvé aucun logiciel (à l’exception de Google Desktop Search abandonné) capable de lire les calques de texte dans les fichiers .djvu.
Mes besoins sont assez simples: je n'ai pas besoin d'indexer les courriels, les métadonnées dans les fichiers JPG, etc. Juste des fichiers PDF et DjVus et peut-être des fichiers texte. J'ai besoin de bien contrôler ce qu'il faut indexer (un seul répertoire, et rien de plus).
J'utilise Windows.
Est-ce que quelqu'un ici connaît une solution à ce problème?
Les programmes que j'ai regardés jusqu'ici sont:
- Beagle
- Copernic Desktop Search
- Terrier
- Google Desktop (discontinué)
Le meilleur conseil est peut-être de s'en tenir à Google Desktop Search. Si oui, peut-il être configuré pour n’indexer que des répertoires spécifiques?
la source
Si vous utilisez Windows 7, vous pouvez installer des IFilters tiers pour PDF et DJVU et utiliser la recherche intégrée, comme expliqué dans la section Comment effectuer une recherche dans des fichiers sous Windows 7? J'ai utilisé les IFilters suivants:
la source