Existe-t-il un moyen portable de télécharger ou de mettre en cache toutes les pages d'un site Web pour les consulter hors ligne? J'ai un vol de cross-country demain, et je voudrais pouvoir mettre en cache quelques pages Web (en particulier la page doc python ( http://docs.python.org/ ), et la référence pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).
Idéalement, j'aimerais un module complémentaire Firefox ou quelque chose comme ça, mais tout fonctionnera bien tant que je pourrai l'exécuter sous Linux.
Réponses:
J'utilise HTTrack .
la source
J'utilise wget avec ces options pour mettre en miroir un site pour une utilisation hors ligne
où
-m active les options de mise en miroir pour mettre en miroir un site localement
-c continue un téléchargement précédent au cas où j'aurais déjà téléchargé quelques pages
-k convertit le href absolu pour pointer vers le local pour un affichage hors ligne
-E garantit que les fichiers ont l'extension .html après le téléchargement.
-np télécharge uniquement les objets sous / a / section / i / et ne met pas en cache l'ensemble du site.
Par exemple, je voulais télécharger la documentation sud mais pas les billets sud, etc ...
J'utilise Windows et exécute wget sur cygwin, mais il existe également un port wget natif pour Windows .
Bien que, dans votre cas, vous pouvez télécharger des documents hors ligne python à partir de la section des documents python
la source
Essayez http://www.downthemall.net/ un plugin Firefox. Je l'ai utilisé pour télécharger 250 pages de PDF dans plus de 20 fichiers distincts. C'est extrêmement puissant. Il a une syntaxe générique / requête qui vous permet d'obtenir chirurgicalement uniquement les fichiers que vous voulez et aucun de ceux que vous ne voulez pas.
la source
Quelques extensions Firefox que je connais:
ScrapBook
ScrapBook Plus
UnMHT
Pocket (pas une extension; une fonction Firefox intégrée)
Notez que:
la source
Vous pouvez télécharger un site Web entier ou une partie d'un site Web avec wget.
Consultez le manuel de wget pour d'autres options que vous voudrez peut-être passer, par exemple pour limiter votre utilisation de bande passante, pour contrôler la profondeur de récursivité, pour configurer des listes d'exclusion, etc.
Une autre approche de la navigation hors ligne consiste à utiliser un proxy de mise en cache. Wwwoffle est celui qui possède de nombreuses fonctionnalités pour faciliter la rétention pour la navigation hors ligne, telles que des remplacements aux dates d'expiration spécifiées par le serveur et une capacité de prélecture récursive. (J'utilise wwwoffle depuis mes jours de connexion.)
la source