Je voudrais convertir un document PDF en une collection de pages HTML présentant un balisage «propre», générer / conserver des informations sémantiques (chapitres, sections ...), ainsi que réaliser des tâches de nettoyage (par exemple, la page ne m'intéresse pas. chiffres ou en répétant le titre du...