Comment pourrais-je gratter le texte d'un site? [fermé]

1

Schemer est en train de fermer ses portes et j'essaie de préserver le texte car il y a beaucoup de bonnes idées sur le site. Je voudrais obtenir le texte de chacun des liens énumérés sur le plan du site .

Est-ce qu'il y a un moyen de faire ça? HTTrack ne fonctionne pas comme je le voudrais.

Matt
la source

Réponses:

0

Wget est un outil classique en ligne de commande pour ce type de tâche. Il est fourni avec la plupart des systèmes Unix / Linux, et vous pouvez également l’obtenir pour Windows.

Vous feriez quelque chose comme:

wget -r --no-parent https://www.schemer.com/sitemap?lo=1

Pour plus de détails, voir le Manuel Wget et son exemples , ou jetez un oeil à ceux-ci:

http://linuxreviews.org/quicktips/wget/

http://www.linuxjournal.com/content/downloading-entire-web-site-wget

Giancarlo Colfer
la source