«Afficher la source», équivalent aux documents Word?

11

Parfois, les documents Word semblent plus ou moins rompus, généralement lorsque la mise en page est devenue assez complexe et que le document a changé de mains et / ou de versions plusieurs fois. Les symptômes peuvent être que rien ne se produit lorsque vous appuyez sur les touches Backspaceou Enterà un certain emplacement du document où il devrait vraiment fonctionner, ou que la mise en forme semble s'appliquer et se réinitialiser de façon plus ou moins aléatoire. Je pense que nous avons tous été là.

Souvent, il peut être très difficile de savoir exactement ce qui ne va pas, car ce qui se passe sous le capot dans Word est assez opaque. Vous pourriez avoir un document qui semble vide, mais en réalité l'état sous-jacent concernant la mise en forme, etc. peut être assez complexe.

Dans ces cas, il serait utile de jeter un œil au code source derrière ce qui est affiché sur la page; comme la façon dont vous dans un navigateur pouvez faire View Source , et idéalement être capable de faire des modifications directement dans le code source, comme la façon dont vous le feriez lorsque vous utilisez Latex. Existe-t-il une commande ou un utilitaire de type View Source pour les documents Microsoft Word?

Je suppose qu'il n'y a pas une telle commande, ou j'en aurais entendu parler. Si tel est le cas, quelqu'un a-t-il une bonne approche lorsqu'il s'agit de maîtriser la "mise en forme cachée" ennuyeuse dans un document Word ?

Je soupçonne qu'il pourrait y avoir des différences dans les formats .doc et .docx; Je m'intéresse aux deux cas.

Marraine
la source

Réponses:

11

Si la mise en forme est ce qui vous intéresse principalement, Word a une bonne fonction pour inspecter tous les types de mise en forme appliqués au texte et aux objets appelés Révéler la mise en forme . Dans Word 2007 et 2010, le raccourci pour ce panneau est Shift+ F1.

entrez la description de l'image ici

Sinon, si vous recherchez une compréhension encore plus approfondie du format du document, vous pouvez consulter le XML pour les fichiers DOCX.

  1. Trouvez votre document DOCX sur disque.
  2. Modifiez l'extension du document de .docx en .zip.
  3. Double-cliquez sur le fichier et ouvrez-le dans le gestionnaire d'archives par défaut.
  4. Accédez au dossier "Word" dans le programme zip et ouvrez Document.xml . C'est le code derrière ce qui constitue la majeure partie du contenu du document, bien que les autres fichiers soient également utilisés d'autres façons, par exemple pour les styles ou les informations de police.

Vous aurez certainement besoin d'un éditeur XML décent juste pour afficher les données et même alors, c'est assez complexe et pour un grand document, ce sera très très long.

Quand il s'agit de DOC, il n'y a pas de moyen facile de "visualiser la source" car c'est un fichier binaire composé de flux séparés et donc il n'y a pas de moyen facile de visualiser le contenu.

Adam
la source
C'est assez pratique, je ne le savais pas. Dommage que vous ne puissiez pas faire de même pour les fichiers .doc, car c'est ce que mon entreprise utilise toujours. Merci pour l'explication!
Godsmith
1
@Godsmith Vous pouvez enregistrer le DOC en tant que DOCX en utilisant une version plus récente de Word, puis revenir au DOC après avoir apporté les modifications. Il y a une perte de format dans ce processus, alors soyez prudent, mais vous pouvez trouver que vous pouvez apporter des modifications ou résoudre des problèmes dans vos types DOC en le faisant dans DOCX.
ThisClark
vous pouvez également enregistrer tous les fichiers directement au format HTML dans MS Word. Alternativement, vous pouvez enregistrer au
format
3

Je suppose que le format .doc est assez difficile, donc je ne peux pas vous aider ici. Cependant, .docx est en fait un fichier zip avec tous les détails stockés dans des fichiers XML. Ainsi, renommez le fichier en .zip et jetez un œil à la source!

Peter Albert
la source
0

Quand il s'agit d'un format binaire comme * .doc, les choses sont plus compliquées. Vous pouvez utiliser le mso-dumper de LibreOffice . Clonez simplement la solution sur votre machine locale et exécutez

python doc-dump.py \path\to\file.doc >output.xml

Maintenant, toutes les choses dans le fichier binaire seront converties en xml au format exact décrit dans Word (.doc) Format de fichier binaire

Il y a aussi WordFileDump qui est plus simple mais pas aussi puissant que mso-dumper

Malheureusement, ce n'est que pour analyser la structure et il n'y a pas d'outil pour réassembler la sortie xml dans un fichier * .doc, donc une fois que vous avez trouvé la cause racine, vous devrez utiliser Word pour le modifier. Par conséquent, il serait plus facile de convertir en * .docx, d'examiner le fichier * .docx puis de reconvertir en * .doc si nécessaire

Ou vous pouvez également enregistrer le fichier au format rtf qui est un fichier texte "lisible par l'homme" au lieu de XML Office. Vous pouvez également enregistrer le fichier Word au format HTML

phuclv
la source