Cette question a déjà une réponse ici:
- Comment puis-je télécharger un site web entier? 19 réponses
Existe-t-il un moyen de récupérer le code source de chaque page Web d'un site Web et de le sauvegarder dans un seul fichier texte? Avec les caractères CRFL appropriés, comme si les pages étaient récupérées individuellement sous Internet Explorer? J'ai essayé Wget, mais je n'arrive pas à trouver la bonne combinaison d'options.
Réponses:
Si le serveur Web a été configuré correctement, non, cela n’est pas possible. En effet, si vous pouviez télécharger le code source de sites Web, vous pourriez récupérer des données précieuses telles que les détails d'authentification de la base de données du site Web.
Vous pouvez toutefois télécharger le code HTML rendu de la page Web, tel qu'il apparaît dans votre navigateur Internet, avec
wget
:Cependant, si certains serveurs Web peuvent être traités
wget
comme un robot (un programme qui récupère et enregistre des données de pages Web), dans ce cas, vous pouvez utiliser les-e robots=off
commutateurs de votrewget
commande.la source