EDIT: la vue des tâches CRAN Web Services and Services contient une liste beaucoup plus complète des sources de données et des API disponibles dans R. Vous pouvez soumettre une demande d'extraction sur github si vous souhaitez ajouter un package à la vue des tâches.
Je fais une liste des différents flux de données déjà connectés à R ou faciles à configurer. Voici ma liste initiale de paquets, et je me demandais quoi d'autre me manquait.
J'essaie de limiter cette liste aux flux de données / API "en temps réel" ou "presque en temps réel", où les données sous-jacentes pourraient changer entre les téléchargements. Il existe de nombreuses listes de jeux de données statiques, qui ne nécessitent qu'un téléchargement.
Cette liste est actuellement biaisée en faveur de données financières / de séries chronologiques, et je pourrais utiliser votre aide pour l’étendre à d’autres domaines.
Free Data:
Source de données - Paquet
Google Finance données historiques - quantmod
bilans Google Finance - quantmod
données historiques Yahoo Finance - quantmod
données historiques Yahoo Finance - tseries
Yahoo Finance chaîne options actuelles - quantmod
Yahoo Finance estimations des analystes historiques - fImport
Yahoo Finance Statistiques clés en cours - fImport - semble être cassé
Taux de change historiques OANDA / prix des métaux - indicateurs quantitatifs
historiques FRED de Quantmod - indicateurs macroéconomiques historiques de la
Banque Mondiale quantmod - WDI
Données historiques du volume de recherche de Google Trends - RGoogleTrends
Google Docs - RGoogleDocs
Stockage Google - RGoogleStorage
Twitter - twillR
Zillow - Zillow
New York Times - RNYTimes
Recensement américain de 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - requiert un compte gratuit
FactualR -
adresses renseignées - FactualR
Geocode RDSTK
carte coordonnée aux frontières politiques - RDSTK
Weather Underground - Rouler soi-même
Google Nouvelles - Réaliser votre propre
Sciences de la Terre netCDF données - Réaliser votre propre
données climatiques - Réaliser votre propre
données sur la santé publique - Réaliser votre propre
OAI Harvester - Open Initiative Archives Arracheuse
RAmazonS3 - S3 serveur de stockage Amazon
Rflikr - Flikr api
Nécessite un abonnement:
Bloomberg - RBloomberg
LIM - LIM des
métiers et des citations de NYSE - RTAQ
Interactive Brokers - IBrokers
la source
Réponses:
Vous trouverez ici des instructions pour utiliser R pour télécharger des données netCDF , un format commun utilisé pour stocker des données de science de la Terre, par exemple, des données géospatiales marines de OpenEarth ou un pilote de modèle climatique et des prévisions d’ UCAR.
rnpn (en cours de développement) vous permet d'obtenir des données du National Phenology Network - un projet de science citoyenne permettant de suivre le moment de la verdure, de la floraison et de la sénescence des plantes. Voir le blog du développeur .
-obsolete- RClimate fournit des outils pour télécharger et manipuler des données climatiques sous forme de fichier simple (avec des tutoriels, y compris ici -
Téléchargez les données financières historiques avec
tseries::get.hist.quote
Documents de Michael Samuel téléchargeant des données de santé publique
raster::getData
donne accès aux variables climatiques via WorldClimla source
Un projet visant à créer des packages R avec cet objectif (interface R pour les API temps réel), appelé rOpenSci , comprend 18 packages actuellement disponibles ou en cours de développement. Certains (rnpn, rfishbase) sont déjà sur votre liste.
Grande liste! et divulgation complète - je fais partie du projet rOpenSci.
la source
la source