Comment formater deux colonnes OCR PDF en une seule

0

Je ne parviens pas à lire un fichier PDF sur mon Kindle parce que le texte OCR est affiché sur deux colonnes par page. (Le livre a été numérisé deux fois à la fois, en OCR.) Comment puis-je le formater en une colonne (ou n'importe quel style) pour pouvoir le lire sur mon Kindle?

grosses
la source

Réponses:

5

La dernière version de k2pdfopt peut conserver l’OCR avec l’ option de sortie PDF native (-mode 2col) ou restaurer l’OCR à l’aide de son propre OCR . Par ailleurs, l’exécution de la sortie k2pdfopt via Caliber, comme certains l’ont suggéré, n’est pas nécessaire si vous utilisez les paramètres corrects dans k2pdfopt.

Edit: La version v2.x de k2pdfopt, publiée le 3 sept. 2013, conservera le texte précédemment OCR par défaut même lorsqu'il n'est pas utilisé en mode de sortie PDF natif (par exemple, lors du redimensionnement de texte).

willus
la source
1
Notez également qu'il est possible d'exécuter k2pdfopt directement sur votre kindle à l'aide de kindlepdfviewer ou de ses fourchettes. De plus amples informations et des liens sont donnés ici .
Tim
1

Trouvé ce guide. Fondamentalement, utiliser k2pdfopt pour convertir les deux colonnes en une seule. Et puis cela passe par Calibre pour une version plus propre.

Ceci est une solution partielle car elle supprime les avantages de l'OCR. Le fichier résultant est uniquement des images et donc très volumineux.

grosses
la source