Comment «cat» ou «moins» un fichier .odt d'écrivain libreoffice?

26

Existe-t-il un moyen catou lessun fichier .odt comme antiwordpour les fichiers .doc?

Avio
la source

Réponses:

35

La solution utilise odt2txt. Maintenant, cette commande est fournie par deux packages différents, à savoir celui appelé odt2txtque vous pouvez installer avec

sudo apt-get install odt2txt 

et par le package unoconv(qui offre également des conversions en ligne de commande entre plusieurs formats libresoffice), qui est installé par

sudo apt-get install unoconv

Si vous avez les deux, vous pouvez basculer entre eux en utilisant le mécanisme alternatif :

sudo update-alternatives --config odt2txt

Si vous utilisez le odt2txtfourni par le package que odt2txtvous utilisez

odt2txt file.odt

si vous utilisez le unoconvpackage fourni, vous devez utiliser

odt2txt --stdout file.odt

Les canaliser lesspour avoir une expérience moins semblable ( odt2txt file.odt | less)

Notez que si vous n'utilisez pas cette --stdoutoption, le package fourni par unconv écrira le résultat dans un fichier appelé file.txt.

Le paquet suggéré par la distribution semble être celui du odt2txtpaquet (il a une priorité par défaut plus élevée dans le système alternatif); c'est sûr qu'il a moins de dépendances.

Rmano
la source
Fantastique, merci! Oui, j'ai installé le odt2txtpackage et il se comporte comme il se doit.
Avio
Le problème avec unoconv, comme je l'ai découvert, est qu'il souhaite installer une ancienne version de Libre Office si vous en avez une plus récente. Par conséquent, restez avec sudo apt install odt2txt.
Paddy Landau
@PaddyLandau J'ai fortement modifié la réponse, merci pour l'astuce.
Rmano
@Rmano Vous m'avez aussi appris update-alternatives, merci.
Paddy Landau
7

Vous pouvez parcourir le texte sans aucun utilitaire spécial. Le fichier ODT est une archive zip renommée. Décompressez-le et vous verrez plusieurs fichiers. L'un d'eux, content.xmlcontient tout le texte et est moreou lesslisible.

Barafu Albino
la source
2

Vous ne pouvez pas catou lessou moreun fichier .odt car il s'agit d'un fichier binaire. Il s'agit en fait - comme cela a été dit plus tôt - d'une archive .zip renommée, vous devez donc extraire le content.xmlfichier, mais comme cela implique, c'est un document XML, vous devez donc le traiter comme tel pour en extraire les informations.

Paul Robinson
la source