Parfois, les documents Word semblent plus ou moins rompus, généralement lorsque la mise en page est devenue assez complexe et que le document a changé de mains et / ou de versions plusieurs fois. Les symptômes peuvent être que rien ne se produit lorsque vous appuyez sur les touches Backspaceou Enterà un certain emplacement du document où il devrait vraiment fonctionner, ou que la mise en forme semble s'appliquer et se réinitialiser de façon plus ou moins aléatoire. Je pense que nous avons tous été là.
Souvent, il peut être très difficile de savoir exactement ce qui ne va pas, car ce qui se passe sous le capot dans Word est assez opaque. Vous pourriez avoir un document qui semble vide, mais en réalité l'état sous-jacent concernant la mise en forme, etc. peut être assez complexe.
Dans ces cas, il serait utile de jeter un œil au code source derrière ce qui est affiché sur la page; comme la façon dont vous dans un navigateur pouvez faire View Source , et idéalement être capable de faire des modifications directement dans le code source, comme la façon dont vous le feriez lorsque vous utilisez Latex. Existe-t-il une commande ou un utilitaire de type View Source pour les documents Microsoft Word?
Je suppose qu'il n'y a pas une telle commande, ou j'en aurais entendu parler. Si tel est le cas, quelqu'un a-t-il une bonne approche lorsqu'il s'agit de maîtriser la "mise en forme cachée" ennuyeuse dans un document Word ?
Je soupçonne qu'il pourrait y avoir des différences dans les formats .doc et .docx; Je m'intéresse aux deux cas.
la source
Je suppose que le format .doc est assez difficile, donc je ne peux pas vous aider ici. Cependant, .docx est en fait un fichier zip avec tous les détails stockés dans des fichiers XML. Ainsi, renommez le fichier en .zip et jetez un œil à la source!
la source
Quand il s'agit d'un format binaire comme * .doc, les choses sont plus compliquées. Vous pouvez utiliser le mso-dumper de LibreOffice . Clonez simplement la solution sur votre machine locale et exécutez
Maintenant, toutes les choses dans le fichier binaire seront converties en xml au format exact décrit dans Word (.doc) Format de fichier binaire
Il y a aussi WordFileDump qui est plus simple mais pas aussi puissant que mso-dumper
Malheureusement, ce n'est que pour analyser la structure et il n'y a pas d'outil pour réassembler la sortie xml dans un fichier * .doc, donc une fois que vous avez trouvé la cause racine, vous devrez utiliser Word pour le modifier. Par conséquent, il serait plus facile de convertir en * .docx, d'examiner le fichier * .docx puis de reconvertir en * .doc si nécessaire
Ou vous pouvez également enregistrer le fichier au format rtf qui est un fichier texte "lisible par l'homme" au lieu de XML Office. Vous pouvez également enregistrer le fichier Word au format HTML
la source