Je souhaite télécharger des fichiers HTML (exemple: http://www.brpreiss.com/books/opus6/ ) et les joindre à un code HTML ou à un autre format que je peux utiliser sur le lecteur de livres électroniques. Les sites avec des livres gratuits n'ont pas de pagination standard, ce ne sont pas des blogs ou des forums, donc je ne sais pas comment effectuer une exploration et une fusion automatiques.
ebook
web-crawler
Hrvoje Hudo
la source
la source
La façon dont je le faisais était Calibre.
Cela est devenu trop pénible, alors j'ai construit une extension Chrome pour le rendre plus facile.
Cela s'appelle EpubPress ( http://epub.press ).
Il vous permet de créer un ebook à partir de vos onglets Chrome.
J'espère que ça t'as aidé!
la source
Pandoc peut prendre un lien vers une page (ou un fichier html) et le convertir en pdf / epub ...
Je ne sais pas si ça ramperait. Si ce n'est pas le cas, vous pouvez d'abord explorer les pages avec wget ou quelque chose (ou simplement collecter des liens) et les donner à pandoc.
la source
Vous pouvez utiliser https://getpocket.com et la recette de poche en calibre accessible via le menu "Fetch news".
la source
HTTrack est une bonne option - il va construire un ebook à partir d'un site Web: Il est disponible en téléchargement à partir d'ici: https://www.httrack.com/ HTTrack "vous permet de télécharger un site Web à partir d'Internet vers un site local , en créant de manière récursive tous les répertoires, en obtenant du HTML, des images et d'autres fichiers du serveur vers votre ordinateur. HTTrack organise la structure de liens relative du site d'origine. "
Vous pouvez ensuite convertir le HTML en EPUB, AZW3 ou PDF à l'aide de Calibre ou de tout autre logiciel de conversion HTML en epub.
EpubPress est une deuxième option pour convertir directement en EPUB: il a des extensions pour permettre l'utilisation de Firefox (v44.0 + uniquement) ou Chrome. Pour utiliser ce logiciel, vous devez ouvrir une fenêtre de navigateur. Chaque onglet est essentiellement un «chapitre» de votre ebook. Organisez les onglets dans l'ordre d'apparition souhaité, puis activez epubpress - il téléchargera et organisera les onglets dans leur ordre d'apparition, au format .epub. J'espère que cela t'aides!
* Cependant, notez qu'EpubPress télécharge des pages Web discrètes - pas un «site Web», chez HTTrack. Pour télécharger un site Web avec EpubPress, vous devez ouvrir chaque lien sur le site Web sous la forme d'un onglet distinct, puis utiliser Epubpress pour collecter ces liens au format .epub.
la source