Quel format voulez-vous que les fichiers txt soient? Dépouillé de tout formatage, ou un peu plus riche, par exemple Markdown, comme ce site le prend en charge?
Daniel Beck
Réponses:
4
Vous n'avez pas mentionné quelle saveur d'UNIX mais je pense qu'il y a un textutil sur beaucoup.
-convert fmt Convert the specified files to the indicated format and
write each one back to the file system.
fmt is one of: txt, html, rtf, rtfd, doc, docx, wordml,
odt, or webarchive
antiword ne fonctionne pas avec les documents rtf, pour autant que je sache.
dino
@dino: Vous avez raison, mon erreur.
Thor
3
Il y a "unrtf", mais bien que les données du paquet Ubuntu prétendent pouvoir créer une sortie texte, la page d'accueil GNU unrtf ne mentionne pas ce format. Mais vous pouvez peut-être essayer cela.
Ubuntu a raison. La page de manuel indique: --text sélectionne la sortie de texte ASCII brut.
Themroc
2
Un rapide coup d'œil sur un fichier RTF suggère que le balisage RTF se situe entre {braces}et n'importe quoi entre une barre oblique inverse et un espace \markup. Alors peut strings- être et un court script sed / awk / perl pour supprimer le balisage vous rapprocherait du texte brut.
Réponses:
Vous n'avez pas mentionné quelle saveur d'UNIX mais je pense qu'il y a un textutil sur beaucoup.
http://www.unix.com/man-page/All/1/TEXTUTIL/
la source
Il en existe de nombreux différents, voici ceux que j'ai testés avec succès (tous open source et gratuits):
la source
Il y a "unrtf", mais bien que les données du paquet Ubuntu prétendent pouvoir créer une sortie texte, la page d'accueil GNU unrtf ne mentionne pas ce format. Mais vous pouvez peut-être essayer cela.
la source
Un rapide coup d'œil sur un fichier RTF suggère que le balisage RTF se situe entre
{braces}
et n'importe quoi entre une barre oblique inverse et un espace\markup
. Alors peutstrings
- être et un court script sed / awk / perl pour supprimer le balisage vous rapprocherait du texte brut.la source