Je souhaite modifier les métadonnées d'un PDF numérisé pour attribuer des numéros de page personnalisés à différentes pages. Par exemple, quelles sont maintenant les pages 1-3 que je pourrais vouloir appeler i, ii et iii, et quelles sont les pages 4-10, je veux appeler 1-7. Je ne pas souhaite modifier l'ordre réel des pages.
Existe-t-il A) un moyen de le faire en utilisant des outils gratuits; et B) Un moyen de le faire "en lot" (donc, sans avoir à renuméroter chaque page manuellement).
software-recommendation
pdf
MarkovCh1
la source
la source
Réponses:
Voici une solution basée sur LaTeX. Il utilise le
pdfpages
package pour inclure le PDF numérisé (appelé iciscan.pdf
). Les étiquettes de page PDF que vous souhaitez peuvent être définies à l'aide duhyperref
package avec l'pdfpagelabels
option activée. Il utilise la\thepage
macro normale comme une étiquette qui peut être définie pour les nombres romains en minuscules. Le compteur de pages est ensuite réinitialisé et remis à des nombres normaux.Placez le code ci-dessus dans un fichier (par exemple
scan_mod.tex
) et compilez-le avecpdflatex
:Cela produira
scan_mod.pdf
. Cependant, toutes les annotations spéciales incl. les hyperliens disparaîtront. Cela ne devrait pas poser de problème avec les PDF numérisés.Si vous en avez besoin plus souvent, vous pouvez écrire un script qui accepte le nombre de pages numérotées romaines et le (s) nom (s) de fichier comme arguments et crée un fichier temporaire avec le code ci-dessus où le nom et les nombres sont des variables, qui est ensuite compilé.
la source
Vous pouvez le faire avec un éditeur de texte.
Comme le dit la réponse, ouvrez un fichier PDF avec un éditeur de texte, recherchez une
/Catalog
entrée, puis ajoutez une entrée nommée/PageLabels
comme ceci:Notez que les index de page (numéros de page physiques) commencent par
0
.Bien sûr, vous pouvez le faire automatiquement en utilisant des langages de script.
Normes PDF - Les étiquettes de page ont des spécifications détaillées.
la source
jPDF Tweak est un utilitaire graphique Open Source qui offre la numérotation des pages (le terme correct est "étiquetage des pages") et de nombreuses autres fonctionnalités d'édition PDF de niveau débutant à avancé. Il fonctionne sur Ubuntu et d'autres systèmes d'exploitation.
La page Documentation fournit des instructions pas à pas.
la source
Il existe un outil appelé PDF Mod qui est un outil gratuit pour réorganiser les pages d'un PDF.
Il peut être installé à partir du Centre logiciel Ubuntu dans Ubuntu 10.10 et supérieur.
Pour installer dans Ubuntu 9.10 ou 10.04:
Pour installer Ajoutez le ppa
ppa:pdfmod-team/ppa
à vos sources logicielles ( voici comment faire ) et installez pdfmod depuis le centre logicielAdapté de: http://www.webupd8.org/2011/03/edit-pdf-documents-in-linux-with-pdf.html
Bonne chance: D
la source
Je viens de trouver un pointeur qu'il pourrait être possible d'utiliser
ghostscript
pour cela, ici: pdftk - Ajouter et modifier des signets en pdf - Unix et Linux - Stack Exchange # 18600 ; il s'agit de liens:Cependant, ce qui précède concerne les signets - pas la pagination logique. Il résulte de pdfmarkReference.pdf , la "commande" nécessaire est '
/Label
' (ou '/PAGELABEL
') - et il se réfère en outre au chapitre 8.3.1 "Etiquettes de page" de PDFReference.pdf . Malheureusement, ce chapitre n'explique pas nécessairement comment les pdfmarks pourraient être utilisés avec les étiquettes de page - mais ce post fait:... et plus loin dans ce fil:
EDIT: juste pour montrer ceci - si vous l'avez enregistré en tant que
pdfmarks
fichier:... et vous appelez:
... alors vous obtiendrez trois pages vides ajoutées à la fin de
infile.pdf
, étiquetées -1, 0 et 1 :)Eh bien, peut-être que cela aide parfois à obtenir un
gs
script plus simple pour renuméroter les pages :) Abientôt!
EDIT2: J'ai compris, je pense - utilisez la même
gs
commande que ci-dessus - et ci-dessous le contenu dupdfmarks
script, qui renumérotera le fichier infile.pdf, il commence donc par -1, 0, 1 ... Il s'agit essentiellement d'un exemple modifié de la référence PDF (voir les commentaires pour plus):la source
Il y a un petit script python, qui peut faire le travail: https://github.com/lovasoa/pagelabels-py
Dans votre cas, appelez:
la source
Openoffice / Libreoffice peut faire l'affaire avec l'extension d'importation PDF et une macro de pagination.
Ce n'est pas une solution parfaite, mais cela fonctionne pour moi (à part l'utilisation de PDF Mod - que je suggérerais fortement).
la source
Essayez pyPdf , une bibliothèque python pour manipuler des documents PDF. Une programmation, mais pas beaucoup, serait nécessaire.
Vous pouvez également jeter un œil à PDFtk , même si je n'ai pas vérifié s'il prend en charge la modification du numéro de page associé à des pages individuelles. Les deux sont disponibles sous forme de packages dans Ubuntu.
la source
Il existe une autre application appelée PDFEdit - hébergée sur la forge source. Page du projet Source Forge - Cependant, cela n'aide pas car il n'a pas les fonctionnalités dont vous avez besoin
la source
pdfedit
peut montrerCatalog/PageLabels
Dict si un document en a un, mais s'il est sélectionné, il dit: " Ce dictionnaire n'a pas de propriétés directement modifiables " ... Bravo!