Habituellement, j'utilise Notepad ++ pour rechercher des fichiers à l'aide d'expressions régulières. Aujourd'hui, je me demande s'il existe un programme PDF qui fait de même pour les PDF. Bien sûr, je pourrais convertir le PDF en texte et utiliser Notepad ++, mais y a-t-il un moyen plus simple sans convertir?
15
Réponses:
plusieurs options:
la source
Comme vous l'avez dit, l'alternative évidente consiste à convertir des PDF en texte. Un moyen pour un programmeur de configurer cela pour un traitement en masse est d'utiliser le package Python PDFMiner. L'agent Ransack utilise "pdftotext" du projet Xpdf (et vous le pouvez aussi).
la source