J'essaie de télécharger une URL qui ressemble à http://www.somesite.com/restaurants.html#photo=22x00085
.
Je l'ai mis entre guillemets simples, mais il ne télécharge que http://www.somesite.com/restaurants.html qui n'est pas la bonne page.
Y a-t-il une solution?
Réponses:
wget
fonctionne bien. La syntaxe URI spécifie que le fragment - la#foo
partie - doit être interprété entièrement côté client et non utilisé lors de la récupération du document lui-même.Par exemple, s'il s'agit d'une page HTML, le navigateur peut faire défiler la page jusqu'à une section nommée ou, dans votre cas, déclencher du code JavaScript qui affiche une photo particulière.
En d'autres termes, en ce qui
wget
concerne les URIhttp://www.somesite.com/restaurants.html#photo=22x00085
ethttp://www.somesite.com/restaurants.html
... pointez sur la même page
/restaurants.html
. C'est à votre navigateur de faire le reste. L'ouverturerestaurants.html#photo=22x00085
dans le navigateur devrait fonctionner correctement.la source
Sans visiter le lien approprié, je ne peux pas dire lequel c'est, mais il n'y a que deux options:
Le hachage fait en fait partie du nom du document demandé. Dans ce cas, vous pouvez l'encoder:
Dans l'autre cas, dans des circonstances normales, http://www.somesite.com/restaurants.html et http://www.somesite.com/restaurants.html#photo=22x00085 doivent pointer vers la même page. La partie après le hachage indique simplement l' ancre dans laquelle le navigateur doit défiler après le chargement de la page; il n'est même pas envoyé au serveur.
Cependant, il est possible que le hachage soit (ab) utilisé pour charger une photo particulière avec JavaScript. Wget ne peut pas interpréter JavaScript, vous ne pouvez donc rien y faire.
la source
Ce n'est pas l'URL de l'image. Il s'agit de l'URL d'une page qui utilise un script ou un autre code pour récupérer l'image. Essayez de charger la page avec JavaScript désactivé. C'est ce que wget recherche pour vous.
Pour trouver l'URL de l'image, essayez de visiter la page via votre navigateur, puis cliquez avec le bouton droit sur la photo. Il devrait y avoir une option pour afficher des informations sur l'image, y compris son URL.
Si cela ne fonctionne pas, c'est peut-être parce que l'image est en cours de chargement via Flash ou un autre programme côté client. Vous pouvez utiliser Fiddler ou Wireshark pour regarder quelle URL son chargement.
Si vous nous donnez l'URL réelle du site avec l'image, nous pouvons vous aider à déterminer comment l'image est chargée.
la source