API de données / flux disponibles en tant que packages dans R

53

EDIT: la vue des tâches CRAN Web Services and Services contient une liste beaucoup plus complète des sources de données et des API disponibles dans R. Vous pouvez soumettre une demande d'extraction sur github si vous souhaitez ajouter un package à la vue des tâches.


Je fais une liste des différents flux de données déjà connectés à R ou faciles à configurer. Voici ma liste initiale de paquets, et je me demandais quoi d'autre me manquait.

J'essaie de limiter cette liste aux flux de données / API "en temps réel" ou "presque en temps réel", où les données sous-jacentes pourraient changer entre les téléchargements. Il existe de nombreuses listes de jeux de données statiques, qui ne nécessitent qu'un téléchargement.

Cette liste est actuellement biaisée en faveur de données financières / de séries chronologiques, et je pourrais utiliser votre aide pour l’étendre à d’autres domaines.

Free Data:
Source de données - Paquet
Google Finance données historiques - quantmod
bilans Google Finance - quantmod
données historiques Yahoo Finance - quantmod
données historiques Yahoo Finance - tseries
Yahoo Finance chaîne options actuelles - quantmod
Yahoo Finance estimations des analystes historiques - fImport
Yahoo Finance Statistiques clés en cours - fImport - semble être cassé
Taux de change historiques OANDA / prix des métaux - indicateurs quantitatifs
historiques FRED de Quantmod - indicateurs macroéconomiques historiques de la
Banque Mondiale quantmod - WDI
Données historiques du volume de recherche de Google Trends - RGoogleTrends
Google Docs - RGoogleDocs
Stockage Google - RGoogleStorage
Twitter - twillR
Zillow - Zillow
New York Times - RNYTimes
Recensement américain de 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - requiert un compte gratuit
FactualR - adresses renseignées - FactualR
Geocode RDSTK
carte coordonnée aux frontières politiques - RDSTK
Weather Underground - Rouler soi-même
Google Nouvelles - Réaliser votre propre
Sciences de la Terre netCDF données - Réaliser votre propre
données climatiques - Réaliser votre propre
données sur la santé publique - Réaliser votre propre
OAI Harvester - Open Initiative Archives Arracheuse
RAmazonS3 - S3 serveur de stockage Amazon
Rflikr - Flikr api

Nécessite un abonnement:
Bloomberg - RBloomberg
LIM - LIM des
métiers et des citations de NYSE - RTAQ
Interactive Brokers - IBrokers

Zach
la source
1
dépend de ce que vous entendez par 'facile à configurer' ... J'ai un certain nombre de scripts personnalisés qui sont 'faciles à configurer'
David LeBauer
2
En ce moment, je définis "facile à installer" comme "le paquet existe" ou "quelqu'un a posté / publié une fonction permettant de télécharger les données"
Zach
Je définirais en outre "les packages existent" comme "le package est sur CRAN" ou "le package est sur R Forge", "le package est sur un référentiel public de type CRAN."
Zach
Ajout: API du registre fédéral (en préparation).
Fr.
Ce fil peut également intéresser: importation cours des actions de Yahoo Finance dans R .
gung - Rétablir Monica

Réponses:

8
  1. Vous trouverez ici des instructions pour utiliser R pour télécharger des données netCDF , un format commun utilisé pour stocker des données de science de la Terre, par exemple, des données géospatiales marines de OpenEarth ou un pilote de modèle climatique et des prévisions d’ UCAR.

  2. rnpn (en cours de développement) vous permet d'obtenir des données du National Phenology Network - un projet de science citoyenne permettant de suivre le moment de la verdure, de la floraison et de la sénescence des plantes. Voir le blog du développeur .

  3. -obsolete- RClimate fournit des outils pour télécharger et manipuler des données climatiques sous forme de fichier simple (avec des tutoriels, y compris ici -

  4. Téléchargez les données financières historiques avec tseries::get.hist.quote

  5. Documents de Michael Samuel téléchargeant des données de santé publique

  6. raster::getData donne accès aux variables climatiques via WorldClim

David
la source
Qu'est-ce que "les données netCDF?"
Zach
@Zach NetCDF est une sorte de moyen structuré universel de stocker de grands ensembles de données. Une approche alternative repose sur le format HDF5 .
chl
@ David (+1) Merci beaucoup pour le quatrième point!
chl
Qu'est-il arrivé à RClimate? Je ne trouve le paquet nulle part
Daniel Ryback
Il existe maintenant une bibliothèque ncdf4 sur R pour gérer netcdf4. C'est plus compliqué à installer que ncdf mais ce dernier est obsolète à mon avis. Il y a quelques années, j'ai même réussi à installer netcdf4 avec Min GW64 pour que ce paquet fonctionne sous Windows :) Si je le faisais, cela signifie que c'est faisable ... et il semble que D. Pierce (auteur du paquet) fournit des sources. sur son site web cirrus.ucsd.edu/~pierce/ncdf
robin girard
8

Un projet visant à créer des packages R avec cet objectif (interface R pour les API temps réel), appelé rOpenSci , comprend 18 packages actuellement disponibles ou en cours de développement. Certains (rnpn, rfishbase) sont déjà sur votre liste.

Grande liste! et divulgation complète - je fais partie du projet rOpenSci.

cboettig
la source
1
  1. ONETr - interaction efficace avec l’API O * NET ™, offrant des données de descripteur professionnel du US Department of Labor.
RunChiRun
la source