J'utilise wget --mirror --html-extension --convert-links
pour mettre en miroir un site, mais je me retrouve avec beaucoup de noms de fichiers au format post.php?id=#.html
. Lorsque j'essaie de les afficher dans un navigateur, cela échoue, car le navigateur ignore la chaîne de requête lors du chargement du fichier. Existe-t-il un moyen de remplacer le ?
caractère dans les noms de fichiers par autre chose?
La réponse de a --restrict-file-names=windows
fonctionné correctement. En conjonction avec les drapeaux --convert-links
et --adjust-extension
/ -E
(anciennement nommé --html-extension
, qui fonctionne également mais est obsolète), il produit un miroir qui se comporte comme prévu.
wget --mirror --adjust-extension --convert-links --restrict-file-names=windows http://www.example
http://site.com/article.cgi?25
ci sera enregistrée commearticle.cgi?25.html
voir la section 2.7 sur gnu.org/software/wget/manual/wget.html#HTTP-Optionswget n'a pas d'option pour modifier le nom enregistré. Ce que vous devrez probablement faire est de créer un script à parcourir et à remplacer? avec _ ou quelque chose de similaire. Wget seul ne peut pas faire cela.
la source