Merci pour toutes les réponses, tout le monde. Avec votre aide, j'ai pu compiler une liste de commandes qui peuvent extraire le nombre de pages de presque tous les documents bureautiques pertinents:
DOCX / PPTX
unzip -p 'sample.docx' docProps/app.xml | grep -oP '(?<=\<Pages\>).*(?=\</Pages\>)'
unzip -p 'sample.pptx' docProps/app.xml | grep -oP '(?<=\<Slides\>).*(?=\</Slides\>)'
Remarque : unzip
peut être installé avec sudo apt-get install unzip
.
DOC / PPT
wvSummary sample.doc | grep -oP '(?<=of Pages = )[ A-Za-z0-9]*'
wvSummary sample.ppt | grep -oP '(?<=of Slides = )[ A-Za-z0-9]*'
Remarque : wvSummary
(sensible à la casse!) Fait partie du wv
package. Installez-le avec sudo apt-get install wv
.
ODT
unzip -p sample.odt meta.xml | grep -oP '(?<=page-count=")[ A-Za-z0-9]*'
PDF
pdfinfo sample.pdf | grep -oP '(?<=Pages: )[ A-Za-z0-9]*'
Remarque: pdfinfo
fait partie de poppler-utils
et devrait être préinstallé sur Ubuntu.
DJVU
djvused -e "n" sample.djvu
Remarque: djvused
fait partie du djvulibre-bin
package et peut être installé avec sudo apt-get install djvulibre-bin
.
Je n'ai pas trouvé de moyen d'extraire
odt
les informations sur les fichierspdfinfo
, mais vous pouvez créer un script rapide à utiliserpdfinfo
avec lesodt
fichiers, convertir chaque fichier odt en PDF et supprimer plus tard le fichier converti si vous ne comptez pas l'utiliser:J'espère que cela vous a aidé.
la source