Je souhaite convertir un .pdf
fichier en .odt
fichier afin de pouvoir le convertir davantage en .doc
fichier. Existe-t-il un logiciel / script capable de le faire? J'ai essayé de copier le contenu du .pdf
fichier et de le coller dans liberoffice writer, le formatage n'est pas préservé.
Le document étant confidentiel, je préférerais ne pas utiliser de service en ligne pour la conversion.
Toute aide est grandement appréciée.
format-conversion
Ankit
la source
la source
Réponses:
L'absence d'un convertisseur gratuit de PDF à ODT me gênait également. Je n'avais même pas besoin de quelque chose de compliqué. Juste un outil qui génère des fichiers ODT que je peux ensuite annoter dans LibreOffice (par exemple, pour remplir des formulaires).
Je sais comment procéder manuellement en convertissant le document PDF en fichiers graphiques, puis en les important dans LibreOffice, mais cela devient fastidieux.
J'ai donc finalement écrit un petit script shell rapide qui effectue automatiquement toutes les étapes requises. Vous pouvez le trouver à https://github.com/gutschke/pdf2odt
Il peut prendre un nombre illimité de fichiers PDF et d'images en entrée et génère un fichier ODT pouvant être ouvert et modifié dans LibreOffice. Les images apparaissent en fond de page, vous pouvez donc les écrire librement. Chaque image est associée à son propre style de page. N'oubliez pas cela lors de l'insertion de sauts de page et ajustez le style de page si nécessaire.
J'ai testé le script sous Linux et Mac. Étant donné qu'il ne nécessite qu'une poignée d'outils raisonnablement standard, il devrait être assez portable.
la source
pdf2oo
a quelques années, mais il semble maintenant produire des fichiers corrompus pour LibreOffice. Ce script fait cela et plus encore - merci!Vous pouvez jeter un oeil sur
PDF Utilities
(poppler-utils via Synaptic ou apt-get) qui inclut pdftotext :Bien entendu, le succès dépendra de la manière dont le fichier pdf a été généré. Si vous obtenez ce que vous voulez en tant que fichier texte, vous pouvez alors l'enregistrer en tant que fichier .odt.
Edit: J'ai oublié de fournir la source de la citation. C'est à partir de l'onglet Description dans Synaptic pour
PDF Utilities (based on Poppler).
la source
pdftohtml
doit être la meilleure solution pour la tâche, car HTML peut effectuer le formatage. Ensuite, HTML pourrait être converti en ODT ou DOC.LibreOffice est capable d'importer des
.pdf
fichiers. Ouvrez-le simplement dans une version actuelle de LibreOffice pour obtenir de meilleurs résultats. Cependant, le document sera ouvert en tant que dessin et vous ne pourrez le convertir que dans l'un des formats d'image pris en charge, et non en tant que document Writer.Naturellement, tout le formatage n'est pas préservé, mais au moins certains.
la source
Si le paquet poppler-utils est installé, le script Nautilus ci-dessous (à placer dans le dossier ~ / .gnome2 / nautilus-scripts en tant que fichier exécutable) vous aidera à convertir le fichier PDF en HTML (l'option "-i" peut être supprimée pour être incluse). images), qui peuvent ensuite être ouverts avec LibreOffice Writer et enregistrés au format ODT bien que le succès de la conversion de formatage dépende beaucoup de la manière dont le fichier PDF est créé.
http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym
la source
man pdftohtml
):-noframes : generate no frames. Not supported in complex output mode.
Donc, cela-noframes
n'aura aucun effet avec-c
set.Essayez Calibre. Il convertit en HTML, puis dans d'autres formats. Il a fait un très bon travail sur un fichier volumineux (183 pages) que j'aurais sinon dû imprimer.
Dans mon cas, je l'ai converti en epub, mais pour le plaisir, je l'ai converti en un fichier .docx qui s'est avéré très efficace.
la source