Comment supprimer le filigrane du PDF en utilisant pdftk?

33

Je dois supprimer un filigrane de courrier électronique stupide qui s'étend sur toutes les pages d'un livre du domaine public. J'ai regardé la page de manuel de pdftk et quelques exemples, mais je n'arrive toujours pas à comprendre comment supprimer les filigranes. J'apprécie vos conseils.

hnns
la source

Réponses:

35

tâche très simple à réaliser:

utilisez sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

mais, après, assurez-vous de réparer la sortie résultante pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

le tout en une seule commande:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

les filigranes de texte ne sont rien d'autre qu'un texte entre deux balises à l'intérieur du code compressé pdf

Dingo
la source
1
Fantastique! travaillé comme un charme. veuillez simplement renommer l'adresse e-mail en une adresse fictive. Je ne veux pas que le type de gâter le livre soit ciblé par des spammeurs. D'autant plus que c'est probablement lui qui a réalisé le pdf. Merci beaucoup.
hnns
terminé! Chaîne spécifique modifiée avec une chaîne générique
Est-ce que quelqu'un sait comment modifier cette solution pour se débarrasser d'un filigrane de lien? Je me suis débarrassé du texte, mais il reste encore un petit carré où se trouvait le texte.
425nesp
pdftk s'est écrasé lorsque j'ai exécuté cela.
Cerin
@Dingo comment le traiter par lots? Je veux dire plusieurs fichiers
Clain Dsilva
49

Juste un petit complément à la réponse de Dingo car cela n'a pas fonctionné pour moi:

J'ai d'abord dû décompresser le document PDF afin de pouvoir trouver le filigrane et le remplacer par sed. La première étape consiste à décompresser le document PDF en utilisant pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

maintenant, le uncompressed.pdfpeut être utilisé comme dans la réponse de Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

J'ai ensuite réparé et recompressé le document:

pdftk unwatermarked.pdf output fixed.pdf compress
Philippe
la source
Tu es un sauveur! Merci!!! :)
johndodo
1
C'est vraiment génial!
qed
4
J'ai pris ce processus, je l'ai rendu un peu plus sophistiqué et l'ai enveloppé dans un script Python. C'est sur github ici .
Alexander Garden du
@Alexander Garden Cela ne fonctionne pas, TypeError: str() takes at most 1 argument (2 given)lorsqu'il est utilisé en suivant les conseils d'utilisation donnés
8bitjunkie
2
N'a pas fonctionné pour supprimer le filigrane ajouté par Master PDF Editor.
fccoelho
-2

Pour supprimer www.it-ebooks.info,

ouvrir le PDF dans notepad ++ ou textpad

remplacer www.it-ebooks.info par rien (vide)

enregistrez le fichier

Ouvrir dans un lecteur Adobe standard

Quittez, vous serez invité à enregistrer le fichier

sauvegarde le

user549273
la source
1
Est-ce une solution générale? Qu'est-ce que www.it-ebooks.info?
Karlo