J'ai un problème avec la commande wget suivante:
wget -nd -r -l 10 http://web.archive.org/web/20110726051510/http://feedparser.org/docs/
Il doit télécharger de manière récursive tous les documents liés sur le Web d'origine, mais il ne télécharge que deux fichiers ( index.html
et robots.txt
).
Comment puis-je obtenir un téléchargement récursif de ce site?
10
nombre, mais c'est difficile à deviner. Maintenant , il y a un fichierintroduction.html
,introduction.html.1
,introduction.html.2
et je préfère terminé le processus.--mirror
option pour les liens est dirigée vers le système de fichiers?-nd
, donc différents messagesindex.html
sont placés dans le même répertoire, et sans cela-k
, vous n'obtiendrez pas de réécriture des liens.Télécharge récursivement le contenu de l'URL.
Quelques autres options utiles sont:
la source
-l 0 - remove recursion depth (which is 5 by default)
+1