Convertir des documents Microsoft Word (.doc / x) en fichiers HTML

8

Quelqu'un connaît-il une bonne application pour le faire rapidement et efficacement?

J'ai acheté Word Cleaner mais les résultats sont tout simplement suffisants et je dois parcourir tous les fichiers html générés pour nettoyer des tonnes de balises injectées inutiles comme

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

La plupart des articles affichés sur un site Web que je gère sont basés sur des documents écrits sur MS Word par des gens qui ont peu d'idée de ce que sont des marges ou des listes ordonnées / non ordonnées, des notes de bas de page, etc., et je ne peux pas leur faire utiliser autre chose.

Quelqu'un a-t-il une astuce pour m'aider à gérer ces pages plus efficacement que de les parcourir pour corriger et appliquer mon style CSS?

NB: Pour mémoire, l'utilisation de "Save as HTML DOC" dans Word est pire que Word Cleaner

danie7LT
la source

Réponses:

4

Voici ce que moi et l'équipe ici au travail utilisons pour apporter du contenu MS Word en HTML:

http://word2cleanhtml.com/

Nous vérifions toutes les cases, collons le code, puis convertissons.

J'espère que ça aide.

KruegerDesigns
la source
word2clean est en effet un excellent convertisseur, très propre et exactement ce dont nous avons besoin. Merci !
danie7LT
Très gentil, content d'avoir pu aider!
KruegerDesigns
3

Je pense que la meilleure solution serait d'utiliser un éditeur WYSIWYG. TinyMCE, par exemple, est une bonne - bien que je soupçonne que vous pourriez avoir besoin d'une version autonome. L'utilisation serait similaire à n'importe quel programme de type mot, mais la sortie serait directement HTML. De plus, avez-vous essayé d'autres programmes similaires à des mots, comme OpenOffice ou LibreOffice? Le HTML n'est pas génial, car il a beaucoup de style en ligne, mais à partir d'un test rapide, il semble qu'il n'a pas le problème de beaucoup de balises inutiles.

milo5b
la source
tinyMCE est génial et c'est ce que j'essaie de les faire utiliser. J'ai déjà ajouté plus d'options de mise en forme pour les aider à obtenir ce qu'ils veulent réaliser, mais c'est la migration elle-même de Word vers quelque chose d'autre que j'ai du mal à réaliser et en attendant, je continue à recevoir des fichiers .doc. Mais merci quand même, vous dites qu'OpenOffice donne de bons résultats en convertissant la doc en HTML, eh bien je vais essayer.
danie7LT