Supposons que j'ai un PDF et que je souhaite obtenir toutes les métadonnées disponibles pour ce PDF. Quel utilitaire dois-je utiliser?
Je trouve que l'information que je suis généralement le plus intéressé à connaître est la taille du papier, ce que les lecteurs PDF ne signalent généralement pas. Par exemple, la lettre au format PDF est-elle légale, A4 ou autre? Mais les autres informations disponibles peuvent également être intéressantes.
EDIT: Voici un guide pratique sur les formats de papier, grâce à @terdon.
pdf
file-metadata
Faheem Mitha
la source
la source
Réponses:
L'un des outils canoniques pour cela est
pdfinfo
, qui vient avec xpdf, si je me souviens bien. Exemple de sortie:la source
pdfinfo
en compte.if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
?sqrt(2)
s.Exiftool est un autre utilitaire qui mérite d'être étudié . Ce n'est peut-être pas le bon outil dans votre cas spécifique car il ne fournit aucune information sur la géométrie du document, mais en général, c'est probablement l'outil le plus complet pour inspecter les métadonnées PDF.
Voici un exemple de commande qui imprimera toutes les méta-informations disponibles (
-a
), triées par groupes (-G1
):La documentation officielle offre un aperçu des balises liées au PDF prises en charge:
Vous pouvez installer exiftool sur Debian / Ubuntu avec:
Si vous êtes plutôt du côté de l'interface graphique, vous pouvez essayer mon projet PDFMtEd . Il s'agit d'un ensemble d'outils qui servent d'interface graphique pour améliorer et permettre la visualisation et la modification des métadonnées PDF.
Voici quelques captures d'écran:
la source