Archiver / exporter toutes les entrées de blog à partir d'un flux RSS dans Google Reader [fermé]

9

Existe-t-il un moyen d'exporter ou d'archiver tous les articles de blog à partir d'un flux dans Google Reader?

Parfois, les blogs sont supprimés, mais Google Reader parvient toujours à enregistrer une grande partie de leur contenu.

Comment puis-je exporter ces entrées de blog hors de ce blog et sur un disque dur?

InquilineKea
la source
2
Je ne sais pas comment le faire, mais cela devrait certainement être possible. L'application «Reeder pour iPad» parvient en quelque sorte à extraire les données de Google Reader. Voir aussi cette page. code.google.com/p/google-reader-api/w/list
Zoredache

Réponses:

7

Après vous être connecté à Google Reader, vous pouvez télécharger les 1 000 derniers éléments de chaque flux à l'aide de l'url http://www.google.com/reader/atom/feed/[feed_address 4.0 ?n =1000 . Si vous devez archiver plus de 1000 éléments, vous devez suivre cette procédure (le mot clé est "paramètre de continuation").

tic
la source
2

Vous pouvez toujours accéder au XML brut des flux et créer votre propre méthode pour les analyser et enregistrer les sections importantes sur le disque.

Quelque chose comme cette extension Chrome est utile pour accéder au XML des différents flux que vous avez actifs dans le lecteur.

Avoir ces informations brutes vous permettra d'obtenir le contenu que le blog exposait au monde, mais cela n'obtiendra pas nécessairement l'intégralité du blog de haut en bas. Courir quelque chose comme httrack ne vous permettra de télécharger le blog entier pour une consultation hors ligne.

jonsca
la source
1
Hm je vois - merci pour toutes les infos! Je pensais plus à faire quelque chose comme télécharger le blog entier s'il était supprimé (ou si le serveur tombait en panne) - puisque je suis abonné à des centaines de flux, et que je n'aurais probablement pas le temps de le faire manuellement pour chaque flux - mais faites-le si le blog a été supprimé (ce qui s'est déjà produit)
InquilineKea
2

Je voulais faire la même chose il y a quelques jours, j'ai donc mis en place ce script simple: https://code.google.com/p/getgrfeed/

Le script peut être utilisé pour télécharger l'intégralité d'un seul flux stocké dans Google Reader. Par exemple, si je voulais vider le flux pour BoingBoing, je l'exécuterais comme ceci:

$ python getgrfeed.py http://feeds.boingboing.net/boingboing/iBag

Il commencera alors à imprimer chaque entrée stockée par Google Reader. Bien sûr, BoingBoing est un site très fréquenté, cela prendrait donc un certain temps, mais cela devrait fonctionner. Cela est particulièrement utile pour enregistrer une copie des entrées de blog - ou de sites entiers - qui n'existent plus nulle part ailleurs.

Jeremy
la source
1

RSSOwl est également capable de récupérer les 1000 derniers éléments de chaque flux auquel vous êtes abonné dans Google Reader.

tic
la source