Wget peut-il convertir des liens dans un document HTML local? [dupliquer]

5

Je sais que l' wgeton peut récupérer une page distante et ses dépendances et réécrire le code HTML afin que les srcattributs d' image référencent les images récemment téléchargées.

J'essaie de convertir des fichiers HTML locaux faisant référence à des images sur Internet. j'utilise

wget --mirror --page-requisites --convert-links \
     --directory-prefix=foo \
     --force-html \
     --input-file=my_file.html

Toutes les images référencées sont téléchargées aux emplacements appropriés foo/mais les srcattributs my_file.htmlne sont pas modifiés.

Kevin L.
la source
Ne pouvez-vous pas utiliser regex pour les réparer?
Oui, j'espérais pouvoir utiliser wgetles fonctionnalités intégrées, mais j'ai fini par remplacer les attributs manuellement.
2
Cette question n'est PAS un doublon de la question référencée. Dans cette question, l'OP est utilise --convert-linksqui est synonyme de -k. La question référencée demande quoi faire dans le cas où -k n'était pas utilisé. Cette question, d'autre part, demande comment utiliser l' -koption avec un fichier HTML local . J'ai actuellement le même problème. J'utilise -ket, grâce à la question du PO, j'ai compris comment l'utiliser --input-filepour une entrée locale. Cependant, tout comme pour l'OP, les liens dans le fichier html ne sont pas mis à jour.
Evan de la Cruz

Réponses:

2

Essaye ça:

 wget --recursive   --page-requisites --html-extension=on --convert-links="on" --domains="www.thesite.com" --no-parent http://www.thesite.com  

Cela vous apportera un site Web entier localement. juste essayé, fonctionne bien.
avec des ressources locales

Fatnjazzy
la source
1
J'ai déjà le site web; le problème était que les liens n'étaient pas réécrits. dansmy_file.html
1
@ Kevin L. Veuillez fournir l'URL du site que vous souhaitez télécharger. BTW, si les liens faits en JavaScript, vous ne pouvez pas le faire avec wget. néanmoins, fournissez l'URL.
Fatnjazzy
1
il n'y a pas d'URL. C'est un fichier HTML local.
Evan de la Cruz le