Convertir les notes de bas de page DOCX en HTML ou en texte brut?

0

J'ai une installation de Drupal et un tas de fichiers DOCX. Comme - plusieurs années de sermons dominicaux? Je ne veux pas conserver 99% de la mise en forme, mais ils ont des notes de bas de page. Peu importe comment les notes de bas de page apparaissent quand elles sont ajoutées en tant que contenu Drupal, tant qu'elles apparaissent réellement. J'ai trouvé des convertisseurs DOCX vers HTML, mais ils incluent tous beaucoup de choses de formatage et aucune option de désactivation que je puisse trouver. Comme, l’enregistrement LibreOffice en HTML conserve toutes sortes de polices et d’autres éléments et les transforme en CSS. Enregistrer sous forme de texte dans LibreOffice semble conserver les numéros de note de bas de page, mais perd leur contenu.

Conserver des éléments tels que gras / italique serait bien, mais je ne veux pas de marges, de polices, etc., car le site Drupal a son propre style. C'est juste les notes de bas de page stupides que je ne peux pas perdre.

Alternativement, je suppose qu'un outil permettant de supprimer toutes les balises / styles supplémentaires pourrait également fonctionner, mais je ne suis pas sûr que cela existe.

Merci!

Périphrastique
la source
1
Envoyez-vous en masse des fichiers HTML ou utilisez-vous un éditeur Wysiwyg pour ajouter des publications à l'aide de Drupal? Si vous utilisez un éditeur, certains d'entre eux ont une fonctionnalité spéciale "coller à partir d'un mot" (CkEditor par exemple) qui possède également (peut être configurée pour avoir) une case à cocher "Supprimer le formatage" pour supprimer toutes les balises docx
horatio
Cela a bien fonctionné! Nous ne l'avions pas installé auparavant, mais c'était assez facile et il importe beaucoup plus sainement que toute autre exportation.
Périphrastique