J'ai récemment dû convertir certains PDF
fichiers en SVG
, et j'ai fait cela en ouvrant le PDF dans Illustrator et en l'enregistrant au format SVG.
Le problème était que lorsque Illustrator ouvrait le pdf, de nombreux (mais pas tous) objets texte étaient divisés en différents objets texte. Par exemple, le mot "politique" ne serait pas un objet texte, mais plutôt plusieurs objets texte, "po", "l", "glacé". Il ne semblait pas y avoir de rime ni de raison.
Comment puis-je empêcher que cela se produise?
la source
Si vous souhaitez fusionner du texte cassé tout en préservant autant que possible la mise en forme, le placement, les paragraphes et toute autre typographie du texte existant, plutôt que de le coller dans une zone de texte nouvellement créée sous forme de texte brut, vous pouvez essayer John Wundes. incroyable script Join Text Frames .
Il fait exactement ce qu'il dit sur l'étain: il fusionne des extraits de texte en un seul extrait de texte, en faisant des jugements intelligents en fonction de leur position relative:
C'est vraiment bien!
Notez qu'il ne fonctionne que sur le texte ponctuel, pas sur le texte de zone (très bien ici car les PDF sont presque toujours du texte ponctuel). Si vous essayez de fusionner du texte de zone pour une raison quelconque, vous pouvez le convertir avec le script `` Créer un texte de point '' de Kelso Cartography
Il est également à portée de main est utilisé conjointement avec des AjarProductions de Convertir zone de texte manuscrit (Kelso Cartographie ont également un script similaire, voir le lien ci - dessus), si vous voulez revenir en arrière texte cassé dans dans les zones de texte appropriées avec les paragraphes écoulement automatique:
Trouvez / remplacez les sauts de fin de ligne indésirables. S'il y a beaucoup de paragraphes séparés que vous souhaitez conserver, 1) êtes-vous sûr que vous ne feriez pas mieux d'utiliser InDesign? 2) vous pouvez le faire comme ceci:
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)\|\C.L.O.W.N.H.O.R.R.O.R/|/
\|\C.L.O.W.N.H.O.R.R.O.R/|/
pour un nouveau caractère de paragraphe - qui place un paragraphe là où deux se trouvaient auparavant.Copiez le texte et exécutez le script Convertir en zone de texte dessus. C'est maintenant une zone de texte fluide avec des sauts de paragraphe aux bons endroits.
Malheureusement, rien ne peut réparer le texte esquissé, à l'exception de l'empêcher d'être esquissé, de le retaper ou de faire confiance à un logiciel OCR potentiellement douteux.
la source