Changement de format Word

0

Je regarde des fichiers Word édités en dernier lieu par un ancien assistant. Lorsque "Afficher tous les caractères non imprimables" est désactivé, les modifications de police étranges semblent correctes. Activer "Afficher tous les caractères non imprimables" indique que la mise en forme donne une apparence correcte, mais il ne s'agit clairement pas de la mise en forme saisie par une personne. Un exemple - Le document original avait une numérotation de ligne toutes les cinq lignes. Cette version semble avoir une numérotation de ligne mais ce ne sont que des caractères. Il y a une coupure de section juste avant chaque cinquième ligne. Pour faire un montage de taille modeste, je l'exporte sous forme de texte et je recommence à mettre en forme. Une idée de comment cela pourrait arriver? Est-ce que cela pourrait venir de OCRing un PDF? Un moyen magique de le corriger?

George White
la source

Réponses:

1

Oui, ce type de formatage ressemble à ce qui peut se produire lorsque votre logiciel OCR est configuré pour interpréter ce qu'il a numérisé, alors qu'en réalité, vous avez simplement besoin du texte brut pour appliquer des styles.

Il y a longtemps, sous Windows, nous devions récupérer un document électronique à partir de l'unique copie imprimée restante. Le logiciel avait une fonction de sélection, dans laquelle il:

  1. Scannez la page et affichez l'aperçu
  2. Vous permet de dessiner des marques rectangulaires sur les parties qui vous intéressent (c'était un outil pratique pour ignorer les fragments d'analyse)
  3. Produire des champs de texte contenant le texte numérisé
  4. Fournir un bouton permettant de copier le texte dans le Presse-papiers

La chose à propos de la copie dans le presse-papiers, si vous avez cliqué sur le bouton, il y a eu une interprétation qui introduisait un formatage passable, mais vous n'aviez plus de texte brut.

Cependant, à l'étape (3), si vous avez sélectionné le texte dans le champ de paragraphe par glissement et que vous l'avez copié manuellement dans le Presse-papiers, vous obtiendrez du texte brut, pour lequel il était plus facile d'attribuer des styles.

En ce qui concerne le logiciel Mac, essayez une démonstration du dernier Adobe Acrobat et voyez s'il peut faire un travail décent en faisant de la ROC sur une capture d'écran / numérisation de ces fichiers Word.

Vzzdak
la source