Je recherche sur Google depuis un certain temps, mais je ne trouve pas de réponse à ma question.
J'ai des couches d'OCR indésirables dans un document que j'ai récemment numérisé avec Adobe Acrobat. Il n'a pas été correctement OCR, et je souhaite supprimer certaines informations, mais l'OCR fait l'effacement des informations souhaitées. J'ai converti les fichiers en TIF, mais j'ai remarqué une perte de qualité (très) significative. J'ai entendu dire que l'impression dans un autre PDF conserve le texte ou réduit la qualité de l'image.
J'apprécie toute aide pour résoudre ce problème dès que possible.
Merci.
la source
Après de nombreuses expérimentations, j'ai constaté que l'impression au format Adobe PDF à partir d'Adobe Acrobat imprime le document sans OCR et sans perte de qualité (une résolution imperceptible au premier coup d'œil est perdue).
Cependant, de nombreux sites affirment que cela ne fonctionne pas. J'ai également essayé les autres imprimantes telles que Foxit Reader et OneNote mais la qualité a été réduite. JPEG était aussi le même.
Veuillez garder à l'esprit que votre kilométrage peut varier.
Remarque: je laisse ce fil marqué comme sans réponse dans l'espoir de trouver une meilleure réponse que la mienne.
la source
(il y a un an...)
Si, comme vous le dites, les documents sont numérisés et non imprimés au format PDF à partir de Word par exemple, vous pouvez facilement les supprimer avec votre Adobe:
Sélectionnez Document, Examinez le document et vous pouvez maintenant supprimer le texte masqué (OCR).
la source
Dans Acrobat Pro: utilisez «supprimer les informations cachées» (sous «protection»). Tout sélectionner, exécuter, l'OCR est parti
la source
Dans Acrobat X, sous Protection, il y a un bouton Sanitize Document qui supprime TOUT mais ce qui peut être vu (y compris la couche de texte OCR), convertissant le document en une carte bit aplatie.
la source
Je l'ai résolu en exportant au format JPEG, puis à partir du format JPEG «combiner des fichiers en acrobate». Il s'agit d'un document qui était à l'origine un mot doc et qui avait été converti en PDF. L'OCR a disparu.
la source
J'ai construit un outil pour faire ce rédacteur PDF gratuit . Si vous téléchargez l'image et cliquez simplement sur expurger, cela aplatira votre pdf et supprimera l'OCR. Si vous le souhaitez, vous pouvez également dessiner des marques de rédaction sur le document.
la source