Où puis-je obtenir gratuitement des données brutes publiques? [fermé]

26

Dans le développement Web, un mashup est une page Web ou une application qui utilise et combine des données , une présentation ou des fonctionnalités provenant de deux sources ou plus pour créer de nouveaux services.

Il existe de nombreuses sources pour obtenir des données (informations brutes). Les gouvernements en sont de bons exemples.
Cependant, beaucoup de ces coûts et licences compliquées. Par exemple, SMHI en Suède vend des données de température pendant que notre pays voisin, la Norvège, les donne gratuitement.

On dirait de quel type d'application construisez-vous et de quelles données avez-vous besoin? Je dirais que donnez-moi des données intéressantes et je vais en faire un bon mashup. Je pourrais simplement le tracer sur Google maps par exemple.

La question est donc la suivante: où puis-je obtenir des données gratuites?

Remarque: Je ne suis pas intéressé par l'exploration de données à l'aide d'un webcrawler!

Veuillez partager vos sources avec moi.

Amir Rezaei
la source
Quel type de données recherchez-vous? Juste des données que vous pouvez obtenir gratuitement?
Jetti
Toutes les données qui pourraient avoir un sens pour un grand nombre de personnes.
Amir Rezaei
1
Que diriez-vous odata.stackexchange.com ?
ChrisF
@ChrisF: "Cette page contient les erreurs suivantes: erreur sur la ligne 2 de la colonne 29: caractère 0x0 hors plage autorisée Voici un rendu de la page jusqu'à la première erreur." En cliquant sur le lien odata.
Chris
@Chris - Cela fonctionne bien pour moi, mais si vous avez un cas répétable, signalez le problème à l'équipe de MSO. Je ne suis qu'un modérateur;)
ChrisF

Réponses:

11

Pour des informations générales, un bon point de départ pourrait être la page Open Data de Wikipédia - en particulier les parties inférieures de la page ( organisations promouvant les données ouvertes , voir aussi et liens externes )

J'allais transformer le reste de ce post en une liste de sources de données pour les données nationales et régionales ... mais le Guardian UK Newspaper est déjà parti et a compilé un magasin de données du gouvernement mondial, donc inutile de dupliquer l'effort, au lieu de cela, je '' Je vais juste signaler ...

guardian.co.uk/world-government-data

... pour un catalogue de nombreuses initiatives de données ouvertes au niveau des pays et des villes.
(Il n'est pas basé au Royaume-Uni, bien qu'il semble se concentrer sur les pays anglophones.)

Au moment de la modification, il contient des données pour le Royaume-Uni, les États-Unis, l'Australie, le Canada, la Nouvelle-Zélande et l'Espagne basque.

Une chose qui n'y figure pas mais qui mérite d'être mentionnée est les données cartographiques d'Ordnance Survey UK .

Peter Boughton
la source
Les Gardiens ont également la bonne habitude de fournir les données qui sont référencées dans leurs histoires la plupart du temps.
Jon Hopkins
6

Il y a des données partout de chaque type. La meilleure approche consiste à déterminer le type de données dont vous avez besoin, à trouver un site Web qui en dispose et à voir si le site propose une API. Cependant, voici quelques sources générales:

Yevgeniy Brikman
la source
3

Pour un catalogue complet des données du gouvernement américain et des formats pris en charge, consultez ici: http://www.data.gov/

Robert Harvey
la source
3

New York dispose d'un certain nombre de flux de données de transit MTA gratuits .

Il existe également de nombreux autres ensembles de données publics intéressants à New York, tels que les données d'inspection sanitaire des restaurants.

realworldcoder
la source
3

Quelqu'un a posé à peu près la même question sur Reddit Compsci il y a quelque temps ... voici ce que j'avais à dire alors . Je pense que tout est toujours là.

Parcourez certains de ces sites, je suis raisonnablement sûr qu'il y a quelque chose pour attirer votre intérêt.

Selon ce que vous essayez de faire, il y a des tonnes et des tonnes d'ensembles de données. Un jeu amusant avec, mais qui peut ou non être pertinent pour vous, est l'ensemble de données de messagerie Enron . C'est le résultat de BEAUCOUP de courriels d'entreprise Enron internes qui ont été assignés à comparaître et rendus publics au cours du grand scandale Enron .

Et si vous ne trouvez pas exactement les données que vous recherchez, ne sous-estimez pas la possibilité d'écrire votre propre robot / grattoir. Selon les données que vous souhaitez, il peut être assez simple de simplement explorer le Web pour votre propre ensemble de données. Il existe toutes sortes d'outils - de wget aux droïdes apache - pour vous aider à récupérer des informations par programme.

crime mental
la source
2

Données sur l'eau

Vous pouvez utiliser la NOAA pour récupérer d' énormes quantités de données avec lesquelles jouer. Je l'ai utilisé plusieurs fois et l'API n'est pas à moitié mauvaise. Si vous ne vous souciez pas de quoi et de tout simplement combien j'irais là-bas.

Josh K
la source
0

Windows Azure Marketplace - bien qu'à partir de maintenant, la plupart des sources de données disent «à venir bientôt»

Jason w
la source