Comment transformer un fichier Safari Webarchive en dossier?

16

Je comprends qu'une archive Web Safari est un fichier unique avec le code source et d'autres ressources d'une page Web concaténée en un seul fichier. J'ai trouvé un article Macworld de 2006 décrivant un programme qui fait exactement cela, mais le lien vers le programme n'est plus à jour.

Existe-t-il un logiciel actuellement disponible qui peut convertir un fichier d'archive Web Safari dans un format plus standard?

Daniel
la source

Réponses:

7

WebArchiveExtractor

Je recommande WebArchiveExtractor. Vous pouvez faire glisser des fichiers .webarchive vers cette application qui extraira le fichier dans ses fichiers individuels dans un dossier.

Vous pouvez personnaliser la sortie dans les préférences, notamment en définissant un nom de fichier d'index personnalisé:

WebArchiveExtractor est open source sur GitHub

grg
la source
WebArchive Extractor ne fonctionne pas pour moi au 9 décembre 2019. J'utilise macOS 10.14.4 (18E226) Mojave sur un fichier .webarchive de Safari.
Merchako
11

Existe-t-il un logiciel actuellement disponible qui peut convertir un fichier d'archive Web Safari dans un format plus standard?

Si vous êtes à l'aise avec la ligne de commande, il existe un outil textutilsur Mac OS pour convertir le fichier d'archive Web en txt, html, rtf, rtfd, doc, docx, wordml ou odt.

Exemple:
textutil -convert html /Users/USERNAME/NAME.webarchive


Pour convertir un fichier webarchive en pdf, essayez "Wondershare PDF Editor pour Mac". http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

Ivan Chau
la source
4
L' textutiloutil de ligne de commande extrait uniquement le fichier html de niveau supérieur, et non le CSS ou les scripts qui font également partie de l'archive Web. (Ce qui est vraiment tout l'intérêt de l'archive Web.) Je n'ai pas trouvé d'autre moyen de le faire à partir de la ligne de commande.
Stephen Harrison
1
@Stephen WebArchiveExtractor a une action Automator qui peut être scriptée via le shell.
grg
Malgré les mises en garde, c'est le genre de réponse que je cherchais. Une solution de bases GUI est tout à fait inutile lorsque vous souhaitez convertir des centaines d'archives Web sur un serveur.
Sept
Cela n'extrait même pas le fichier HTML d'origine, mais le convertit. C'est plus comme ouvrir un fichier HTML dans TextEdit et le réexporter.
sam