Exporter: copier le texte du pdf sans saut de ligne

12

Il y a des fichiers PDF dans la nature où chaque ligne de texte semble être codée en dur, donc quand je copie un bloc de texte, tout vient avec: des sauts de ligne et même des séparateurs "-".

Mes questions sont les suivantes: comment créer des PDF dans InDesign où ce problème ne se produit pas.

Quelqu'un en sait-il plus à ce sujet?

KSPR
la source
2
Je voudrais juste dire que c'est un problème énorme dans beaucoup d'articles académiques et je n'ai trouvé aucune raison / solution à ce problème. En espérant de bonnes réponses!
benteh
... c'est donc peut-être une ancienne fonctionnalité d'exportation dans une pratique idiote de l'ère du précambrium qui est à blâmer.
benteh

Réponses:

3

En effet, les PDF peuvent être générés de nombreuses façons à partir d'un certain nombre de logiciels et d'applications en ligne. Chacun d'eux traite différemment les lignes de texte, de sorte que vous ne pouvez jamais savoir comment le texte est réellement enfermé jusqu'à ce que vous essayiez de le copier-coller du PDF vers InDesign.

Cependant, les fichiers PDF exportés par InDesign garderont généralement les espaces à la fin de chaque ligne afin que vous n'ayez pas à vous soucier de l'insertion d'un retour de paragraphe après chaque ligne. Pour être sûr à 100%, Create Tagged PDFcochez la case lorsque vous exportez un PDF depuis InDesign. Personnellement, je vais toujours cocher cette case et l'inclure dans tous les préréglages que j'utilise. Plus de détails sur cette option ici .

Si vous rencontrez un PDF mal exporté et que vous devez nettoyer les retours de paragraphe de fin après chaque ligne de texte, l'option la plus rapide est Rechercher / Remplacer. Tapez ^pdans le Find whatchamp et mettez un espace vide dans le Change tochamp. Sélectionnez soit Storyou Selectionci - dessous en fonction de votre situation et cela devrait nettoyer votre texte.

boîte de dialogue de recherche de changement

Lucian
la source
2

Une façon de procéder consiste à exporter le PDF au format HTML depuis Acrobat Pro , à ouvrir ce fichier dans votre navigateur Web, puis à copier le texte à partir de là.

Contrairement à l'exportation au format texte, le html ne rompt généralement pas les lignes.

À ma connaissance, vous ne pouvez pas empêcher cela d'InDesign, il semble que ce soit un comportement qui vient du PDF ou du logiciel PDF. Il est possible que tout logiciel de publication qui utilise des "cadres / zones de texte" crée ce type de texte dans un PDF.

go-junta
la source
-2

C'est parce que c'est ainsi que pdfs reconnaît le texte - chaque ligne devient en fait un paragraphe (donc retour à la fin). Il n'y a pas moyen de contourner, vous devez le changer globalement dans les documents, après la copie, en utilisant l'option Rechercher / Remplacer et les caractères cachés.

Agnieszka Szuba
la source
1
Mais il y a des pdf qui n'ont pas ce comportement. PDF où vous pouvez copier le tout sans tracas. Je me demande simplement comment cela pourrait être réalisé pendant l'exportation.
KSPR