Duplicata possible:
quel logiciel gratuit puis-je utiliser pour redresser les images numérisées
J'ai plusieurs PDF composés de numérisations de pages de livre. Les numérisations sont faites à partir de deux pages à la fois et certaines de ces numérisations sont asymétriques, donnant au texte une légère inclinaison.
Je recherche un outil qui pourrait me permettre de faire une optimisation automatique en redirigeant les scans sans perdre en lisibilité. J'ai trouvé le logiciel GPL Briss pour recadrer les numérisations afin d'avoir un rapport de page 1: 1 au lieu de 2: 1, mais je n'ai pas d'outil pour redresser les pages.
Je suis tombé sur unpaper , un autre outil open source qui semble parfait pour ce que je veux faire, mais cet outil est uniquement Linux et ne fonctionne pas directement sur les fichiers PDF.
Tout indice est apprécié.
la source
Réponses:
Jetez un oeil à redresser . C'est un outil en ligne de commande. Le téléchargement * zip semble inclure des fichiers binaires pour Windows, MacOSX et Linux.
La licence est MPL (Mozilla) ou LPGL (GNU), selon ce que vous préférez.
Le seul inconvénient pour vous semble être qu'il ne consomme pas de PDF, uniquement des images PNG et TIFF (AFAICS). Cela signifie que vous devrez mettre en place un workflow de s.th. comme:
Je ne l'ai pas testé moi-même (encore), je suis récemment tombé sur le site Web et l'ai mis en signet.
la source
deskew
a réussi à corriger la distorsion liée à la rotation dans mon test, mais malheureusement, il a introduit une fine ligne grise à la position de la bordure de l'image d'origine. Pour me débarrasser de la bordure grise, j'ai recadré les images avec l'-extent
option demogrify
. J'ai seulement testé sur OS X, peut-être que ce mauvais comportement est spécifique à la plate-forme.deskew
fonctionne vraiment bien. Mon flux de travail est le suivant: pdfimages-all <pdf> my_images
→ jbig2-s -p -v my_images* > output
→pdf.py output > deskewed.pdf
Si les bordures noires (résultat de l'opération de redressement) vous dérangent , un traitement avec imagemagick peut être nécessaire, comme suggéré par @StefanSchmidtOh, permettez-moi d'ajouter une autre réponse. Je viens de me souvenir de netpbm . Je ne l'ai pas utilisé depuis des années, mais je pense que je devrais y jeter un nouveau regard ...
netpbm est une boîte à outils très puissante pour la ligne de commande pour manipuler des images graphiques. Il expédie près de 300 outils distincts. Il comprend des convertisseurs pour environ 100 formats graphiques.
Et il dispose également d'un outil en ligne de commande qui peut faire pivoter les images:
Et il a un autre outil qui essaie de découvrir l'angle des images pivotées:
pamtilt
renvoie un nombre flottant de sa supposition de rotation de l'image. La suppression automatique de la distorsion des images doit donc être à portée de main. Un script shell pourrait être écrit pour cela. Cela nécessiterait différentes étapes:pamtilt
pour découvrir automatiquement l'angle d'inclinaison de l'image.pnmrotate
pour dé-biaiser l'image.Si vous me donnez accès à un petit échantillon de vos fichiers PDF, je pourrais essayer de trouver un script shell pour accomplir l'exploit.
(Je me demande fortement que [netpbm] ne semble pas avoir de balise ici sur le superutilisateur + stackoverflow.)
la source