Comment supprimer un filigrane d'un fichier PDF?

41

Je pensais que ce serait une tâche simple, mais cela s'est passé dans l'autre sens.

Le filigrane est la même image (superposée, mais transparente) sur chaque page. J'ai créé le fichier PDF moi-même (donc aucun droit de copyright ici) avec PDFCreator 0.9.8.

J'ai déjà essayé Adobe Acrobat Pro de mon ami, mais cela n'a pas fonctionné. Il essaie de l'enlever, mais il ne peut pas. J'ai essayé de supprimer l'en-tête / le pied de page, etc., mais le filigrane ne disparaît tout simplement pas.

Comment puis-je supprimer le filigrane?

Apache
la source
2
PDF est un format de sortie, comme une page imprimée électronique. Il n'est pas conçu pour être modifié et, dans la plupart des cas, vous ne pourrez pas faire ce que vous demandez, à moins d'exporter les pages au format images et photos, en passant par les filigranes.
mk12
Les recommandations d'achat sont hors sujet pour tous les sites Web d'échange de piles. Pour éviter que cette question ne se termine, je recommanderais de la remplacer par une question "Comment"
Canadian Luke REINSTATE MONICA
3
Il semble que vous utiliseriez simplement PDFCreator 0.9.8 et définiriez l'option pour qu'aucun filigrane ne soit ajouté à chaque page. Je suppose que cette question est parce que vous n'avez pas la source d'origine.
Ramhound le

Réponses:

73

Pour les filigranes à base d’images, plusieurs outils promettent leur suppression automatique. Par exemple:

Toutes ces applications sont gratuites, mais nécessitent une licence pour produire le résultat souhaité.

Cependant, le filigrane de ce fichier PDF spécifique (que l'OP m'a envoyé par courrier électronique) ne correspond pas à une seule image répétée sur toutes les pages. Il se trouve que PDFCreator l'a codé en dur (presque pixel par pixel) dans chacun d'entre eux. Cela rend le filigrane beaucoup plus difficile à supprimer (et aboutit à un fichier PDF plutôt gonflé).

Le filigrane étant en réalité composé de nombreuses images minuscules, vous pouvez les supprimer à l'aide d'un éditeur de PDF (par exemple, Foxit Advanced PDF Editor ), simplement en les sélectionnant et en appuyant sur Delete. Malheureusement, vous devez répéter cela pour chaque page.

Une solution moins longue consisterait à supprimer le filigrane par programme. Nous avons besoin:

Pas

  1. Téléchargez Pdftk et extrayez pdftk.exe et libiconv2.dll dans % windir% \ System32 , un répertoire du chemin ou tout autre emplacement de votre choix.

  2. Téléchargez et installez Notepad ++.

  3. Les flux PDF sont généralement compressés à l'aide de l' algorithme DEFLATE . Cela économise de l'espace, mais rend le source du fichier PDF illisible.

    La commande

    pdftk original.pdf output uncompressed.pdf uncompress
    

    décompresse tous les flux afin qu'ils puissent être modifiés par un éditeur de texte.

  4. Ouvrez le fichier .pdf non compressé avec Notepad ++ pour afficher la structure du filigrane.

    Dans ce cas précis, chaque page commence par le bloc

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    et près de 4000 blocs comme celui-ci. Ce bloc particulier définit uniquement un ( /W 1 /H 1) des pixels du filigrane.

    Si vous faites défiler l'écran jusqu'à ce que le modèle change, le flux du filigrane a une longueur de 95 906 octets (en comptant les nouvelles lignes). Le même flux est répété sur chaque page du fichier PDF.

  5. Appuyez sur Ctrl+ Het définissez les paramètres suivants:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    L'expression régulière q 9 0 0 9 2997 4118\.67 cm.{95881}correspond à la première ligne du bloc ci-dessus ( q 9 0 0 9 2997 4118.67 cm) et à l'ensemble des 95 881 caractères suivants, c'est-à-dire le flux du filigrane.

    Cliquez sur Remplacer tout pour le supprimer de toutes les pages du fichier PDF.

  6. Le filigrane a maintenant été supprimé, mais le fichier PDF contient des erreurs (les longueurs des flux sont incorrectes) et il n'est pas compressé.

    La commande

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    prend soin des deux.

  7. uncompressed.pdf n'est plus nécessaire. Vous pouvez le supprimer.

Le résultat est le même PDF sans le filigrane (et environ la moitié de la taille).

Dennis
la source
4
Autre astuce que j’ai trouvée utile: il m’était difficile de trouver le bloc correspondant au filigrane dans mon PDF. Donc, ce que j'ai fait était d'extraire une seule page du PDF, idéalement une page où il n'y a que le filigrane et pas grand chose d'autre. À partir de cette seule page, il devrait être plus facile de déterminer le bloc qui correspond au filigrane. Revenez ensuite en arrière pour le PDF original.
Kenny LJ
1
Wow, c'est le premier endroit sur Internet où j'ai trouvé un bon moyen de gérer cela. Des endroits que vous recommandez de lire sur le format du conteneur?
ConstantineK
2
@hobs IIRC, j'ai lu des parties de la référence PDF officielle pour écrire cette réponse.
Dennis
1
Merci @Dennis, je vous ai déjà donné un vote positif, mais cela semble être la meilleure source canonique. J'ai pu obtenir ce dont j'avais besoin en effectuant seulement quelques opérations de recherche / remplacement et quelques essais supplémentaires de compression et d'erreur. Aide énorme!
ConstantineK
7
Au lieu de cela, pdftkvous pouvez également utiliser qpdf pour décompresser et compresser les fichiers pdf. Commandes: qpdf --stream-data=uncompress original.pdf uncompressed.pdfetqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler
6

On dirait que le filigrane fait en réalité partie des images du fichier .PDF et non d’une image distincte restituée par tout ce que vous utilisez pour afficher le fichier .PDF. Vous ne pourrez peut-être pas supprimer le filigrane sans extraire les images du fichier .PDF, les exécuter à l'aide d'un éditeur d'image, puis reconstruire manuellement le fichier .PDF.

LawrenceC
la source
4

Pour les filigranes de texte, la modification d’une version PostScript peut être beaucoup plus facile: Après

$ pdftops document.pdf

modifier document.ps, puis reconvertir au format PDF via

$ ps2pdf document.ps

heiner
la source
Sur Linux, méfiez-vous cela pdftopset pdf2pssont différents. Utilisez la première commande, pas la seconde.
Camille Goudeseune
1
Si vous savez ce qu'est le texte en filigrane, voici un one-line. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune
1

Les artefacts du tampon permettent de le supprimer dans Adobe Acrobat Pro. Cependant, il est régénéré par un déplacement de la souris, car l'objet flux le maintient persistant.

Si vous essayez de modifier le source pdf - ce qui est délicat, le fichier risque d’être corrompu.

Si le tampon est un flux, nous pouvons l’interrompre en déconnectant l’ordinateur du Net, ce que j’ai fait.

Puis, en utilisant Adobe Acrobat Pro, j'ai sélectionné l'une de mes annotations, cliqué avec le bouton droit de la souris pour afficher la fenêtre contextuelle, puis sélectionné "Afficher la liste des commentaires".

Sélectionnez le filigrane / tampon néfaste dans la liste, cliquez avec le bouton droit de la souris pour afficher le menu contextuel, puis sélectionnez "Supprimer". Faites cela sur chaque page où l’apposition est effectuée.

Enregistrez le fichier sous un autre nom. Mon application s'est écrasée, mais pas avant l'enregistrement du fichier!

Ouvrez le nouveau fichier et beaucoup plus petit; notez que tous les filigranes / timbres sont en gonzo.

Dans mon cas, la taille de mon document de 3 pages est passée de 300 Ko à 60 Ko. Toutes les données et annotations d'origine sont restées intactes - sans les filigranes.

~ Bonne chasse: o)

Alan Hord
la source
1

convertir le document en fichier .rtf à l’aide de zamzar. La marque d'eau disparaît automatiquement après la conversion. Remarque: - Cela fonctionne parfaitement si le document contient du texte. Cela a toujours été d'une grande aide. (Utilisateur de Mac)

Shifa
la source
Cela ne fonctionne pas pour le PDF que j'ai essayé.
Kenny LJ
1

Trouvé une autre façon de le faire:

  1. Utilisez pdf2htmlEX outil (ou n’importe quel autre convertisseur PDF en HTML) pour convertir le PDF en fichier HTML.
  2. Modifiez le code HTML avec un éditeur de texte et supprimez le filigrane. Sauvegarde le.
  3. Imprimer en HTML dans un nouveau document PDF
  4. Profit
Dominik Antal
la source
Merci. Êtes-vous sûr de ne pas pouvoir supprimer le filigrane avec Adobe Acrobat de cette façon? (Celui-ci pourrait être une solution moins coûteuse.)
Apache
Je crois que vous avez besoin d’un mot de passe pour supprimer le filigrane dans Adobe Reader, c’est pourquoi j’ai utilisé cette méthode.
Dominik Antal
0

Ceci est un complément à la réponse de @Dennis du 18 juillet 2006 à 18h06. Il aborde certainement le cas le plus difficile.

Dans le cas le plus simple où le filigrane est un texte simple, sans fioritures, par exemple

Smedley pour le commissaire

les filigranes PDF non compressés peuvent être définis comme suit:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

75.96est le décalage horizontal et 625le décalage vertical pour cette instance de filigrane particulière. (Oui, les nombres réels et les nombres entiers peuvent être vus.)

Une expression rationnelle comme celle-ci fonctionnera pour tous ces filigranes, en ignorant les variations de leur placement:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Sachez cependant que divers opérateurs de modification de PDF peuvent entrer en jeu avec des filigranes au formatage plus complexe. Une telle fantaisie peut transformer ce que le lecteur espère (espère?) Être une chaîne contiguë facile à rechercher en un fouillis de soupe à l'alphabet. Par exemple,

E 1 = mc² de Smedley ™

Peut-être le produit de ceci:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . ou bien pire si votre filigrane est de couleur améliorée!

Ayant noté tout cela, je noterai également que PDFtk a une version graphique conçue pour gérer les filigranes, moyennant des frais de licence de 4 USD. Pas cher du tout!

D'autre part, je trouve que son site Web annonce actuellement une prise en charge complète des systèmes d'exploitation via Windows 8et OS X 10.8 Mountain Lion. Ce millésime date de plus de 4 ans. PDFtk peut-il devenir obsolète? Je suppose que non, mais je ne sais pas.

Der Schley
la source
Merci pour la recommandation PDFtk, ça a l'air chouette, mais ouais aussi "ça sent" un peu vieillot. La version gratuite est la 2.02, et selon Wikipedia, cette version a bien été publiée il y a 3 ans: en.wikipedia.org/wiki/PDFtk
Apache
1
@Shiki - En fait, j'ai fait des recherches sérieuses sur les formats PDF, mais j'ai abandonné mon évaluation détaillée des progrès réalisés en PDF au cours des 10 dernières années. Voici le résumé: "Les lacunes d'une version de 3 ans de PDFtk à la lumière du développement de spécifications PDF." Bien qu'il y ait eu plusieurs mises à jour depuis, disons, 2005, _ vous allez très bien utiliser _PDFtk_. Je le dis après avoir vérifié certaines sources de documentation PDF modernes disponibles. Tous les documents PDF que j'ai vérifiés ont été créés conformément aux normes PDF antérieures à 2010 ( bien avant, en fait.) En cas de doute, vérifiez les quelques dizaines d'octets supérieurs du fichier PDF en question.
Der Schley