Je voudrais convertir un document PDF en une collection de pages HTML présentant un balisage «propre», générer / conserver des informations sémantiques (chapitres, sections ...), ainsi que réaliser des tâches de nettoyage (par exemple, la page ne m'intéresse pas. chiffres ou en répétant le titre du chapitre / document sur chaque page).
Existe-t-il un tel programme?
À votre santé
la source