De minuscules (réels) ensembles de données pour donner des exemples en classe?

43

Lorsqu'ils enseignent une classe d'initiation, les enseignants que je connais ont tendance à inventer des chiffres et une histoire pour illustrer la méthode qu'ils enseignent.

Ce que je préférerais, c'est raconter une histoire vraie avec des chiffres réels. Cependant, ces récits doivent se rapporter à un très petit ensemble de données, ce qui permet des calculs manuels.

Toute suggestion concernant de tels jeux de données sera la bienvenue.

Quelques exemples de sujets pour les jeux de données minuscules:

  • corrélation / régression (base)
  • ANOVA (1/2 façons)
  • Tests z / t - un / deux échantillons non appariés
  • comparaisons de proportions - tables à deux / plusieurs voies
Tal Galili
la source
pouvez-vous définir «minuscule»? Le calcul «manuel» comprend-il l'utilisation d'une calculatrice?
David LeBauer
Salut David - La calculatrice va bien - mais l'idée est de ne pas avoir trop de nombres (puisqu'ils doivent tous être écrits au tableau)
Tal Galili

Réponses:

26

La bibliothèque de données et d'histoires est une "bibliothèque en ligne de fichiers de données et d'histoires illustrant l'utilisation de méthodes statistiques de base".

Ce site semble avoir ce dont vous avez besoin et vous pouvez le rechercher pour des ensembles de données particuliers.

David
la source
Bonjour David - le site auquel vous avez accédé est vraiment génial - merci.
Tal Galili
Service indisponible actuellement (à partir d'avril 2016)
Felipe Almeida le
@ FelipeAlmeida Je viens d'accéder au site; veuillez vérifier à nouveau, peut-être sur un autre ordinateur / périphérique
David LeBauer
@DavidLeBauer avez-vous essayé de cliquer sur "lister tous les sujets" puis de sélectionner l'une des méthodes? voir ce lien ici
Felipe Almeida
1
@ FelipeAlmeida je vois. J'ai discuté avec le responsable du site, qui a déclaré "Recherchez une nouvelle DASL, plus moderne et bien meilleure, à paraître prochainement sur dasl.datadesk.com".
David LeBauer
23

Il existe un livre intitulé "Un manuel de petits ensembles de données" de DJ Hand, F. Daly, AD Lunn, KJ McConway et E. Ostrowski. Le département statistique de NCSU ont posté électroniquement les ensembles de données de ce livre ici .

Le site Web ci-dessus ne donne que les données; vous auriez besoin de lire le livre pour comprendre l'histoire derrière les chiffres, c'est-à-dire toute autre histoire que ce que vous pouvez extraire du titre de l'ensemble de données. Mais ils sont petits et réels .

utilisateur1108
la source
Ce sont juste la bonne taille. Vous pouvez consulter le livre en effectuant une recherche dans "Manuel de petits ensembles de données" sur Google Scholar - vous pouvez en visualiser des parties sur Google Livres.
Felipe Almeida
Le lien donné est cassé. Veuillez mettre à jour le lien. Merci
MYaseen208
13

Pour les tableaux à double sens, j'aime bien les données sur le genre et la survie des passagers titanesques:

       | Alive  Dead | Total
-------+-------------+------
Female | 308    154  |  462
Male   | 142    709  |  851
-------+-------------+------
Total  | 450    863  | 1313

Avec ces données, on peut discuter de choses comme le test du khi-deux pour l'indépendance et la mesure d'association, comme le taux relatif et le rapport de cotes. Par exemple, les femmes étaient environ 4 fois plus susceptibles de survivre que les hommes. Dans le même temps, les passagers hommes étaient environ 2,5 fois plus susceptibles de mourir que les femmes. Le rapport de cotes pour la survie / la mort est toujours de 10 cependant.

Wolfgang
la source
Bonne idée wolfgang, je n'y ai pas pensé.
Tal Galili
(Le
blog de la communauté a été rédigé
6

CAUSEweb contient des ensembles de données ainsi que de nombreuses autres ressources pédagogiques.

Voir http://www.causeweb.org/resources/datasets/ pour les jeux de données.

CAUSE signifie Consortium pour l’avancement de la formation statistique du premier cycle.

Aaron - Réintégrer Monica
la source
4

Probablement une réponse si évidente qu'il n'est pas vraiment nécessaire de le mentionner, mais pour la régression par corrélation ou linéaire, le quatuor d'Anscombe est un choix logique. Bien que ce ne soit pas une histoire réelle avec des données réelles, je pense que c’est un exemple si simple qu’il pourrait raisonnablement s’intégrer à vos critères.

Andy W
la source
Bon exemple Andy - J'ai appris quelque chose de nouveau aujourd'hui :)
Tal Galili Le
2

Un bel article intitulé Découverte des ressources pour l’enseignement des statistiques a permis de mieux comprendre ce sujet.

MYaseen208
la source
Je viens de terminer la lecture de la majeure partie du document (j’ai parcouru quelques parties), c’est un très bon aperçu de la situation. Il sera intéressant de voir comment cela évoluera à l'avenir ...
Tal Galili
2
Est-il possible que vous ajoutiez les points clés ou donniez un résumé? Le lien peut disparaître à un moment donné, et il aidera également les lecteurs à savoir s'ils souhaitent poursuivre le lien sans avoir à cliquer dessus.
gung - Rétablir Monica
1

https://tuvalabs.com

Je suis sûr que vous avez trouvé ce que vous cherchiez depuis longtemps, mais pour tous ceux qui découvrent un fil conducteur - TuvaLabs est une bonne source pour les jeux de données de Classrooms. Il gère des ensembles de données, une histoire, une description, de petits exercices et des capacités de visualisation. Vous pouvez également demander des ensembles de données à ce sujet.

Mutant
la source