Il y a xpdf qui inclut le pdftotext
binaire.
Pdftotext convertit les fichiers PDF (Portable Document Format) en texte brut.
Sous Linux, un programme d'installation est disponible. Il semble qu'il soit également inclus dans le poppler-utils
package. Sur OS X, vous pouvez l'installer en utilisant Homebrew (installez-le d'abord), puis utilisez
brew install homebrew/x11/xpdf
qui va télécharger les fichiers sources et les compiler pour OS X. Après cela, utilisez-les simplement comme:
pdftotext your_pdf_file.pdf
qui va générer un fichier texte brut. Il existe également quelques options, consultez man pdftotext
pour plus de détails.
Une alternative est poppler , dans OSX:
brew install poppler
dans Debian et ses amis
apt-get install poppler-utils
brew install homebrew/x11/xpdf
brew install Caskroom/cask/pdftotext
Un bon outil pour Windows est l' extracteur de texte A-PDF
la source