Lorsqu'ils enseignent une classe d'initiation, les enseignants que je connais ont tendance à inventer des chiffres et une histoire pour illustrer la méthode qu'ils enseignent.
Ce que je préférerais, c'est raconter une histoire vraie avec des chiffres réels. Cependant, ces récits doivent se rapporter à un très petit ensemble de données, ce qui permet des calculs manuels.
Toute suggestion concernant de tels jeux de données sera la bienvenue.
Quelques exemples de sujets pour les jeux de données minuscules:
- corrélation / régression (base)
- ANOVA (1/2 façons)
- Tests z / t - un / deux échantillons non appariés
- comparaisons de proportions - tables à deux / plusieurs voies
dataset
references
teaching
Tal Galili
la source
la source
Réponses:
La bibliothèque de données et d'histoires est une "bibliothèque en ligne de fichiers de données et d'histoires illustrant l'utilisation de méthodes statistiques de base".
Ce site semble avoir ce dont vous avez besoin et vous pouvez le rechercher pour des ensembles de données particuliers.
la source
Il existe un livre intitulé "Un manuel de petits ensembles de données" de DJ Hand, F. Daly, AD Lunn, KJ McConway et E. Ostrowski. Le département statistique de NCSU ont posté électroniquement les ensembles de données de ce livre ici .
Le site Web ci-dessus ne donne que les données; vous auriez besoin de lire le livre pour comprendre l'histoire derrière les chiffres, c'est-à-dire toute autre histoire que ce que vous pouvez extraire du titre de l'ensemble de données. Mais ils sont petits et réels .
la source
Pour les tableaux à double sens, j'aime bien les données sur le genre et la survie des passagers titanesques:
Avec ces données, on peut discuter de choses comme le test du khi-deux pour l'indépendance et la mesure d'association, comme le taux relatif et le rapport de cotes. Par exemple, les femmes étaient environ 4 fois plus susceptibles de survivre que les hommes. Dans le même temps, les passagers hommes étaient environ 2,5 fois plus susceptibles de mourir que les femmes. Le rapport de cotes pour la survie / la mort est toujours de 10 cependant.
la source
Le Journal of Statistical Education possède des archives de jeux de données sur l'éducation.
la source
CAUSEweb contient des ensembles de données ainsi que de nombreuses autres ressources pédagogiques.
Voir http://www.causeweb.org/resources/datasets/ pour les jeux de données.
CAUSE signifie Consortium pour l’avancement de la formation statistique du premier cycle.
la source
Probablement une réponse si évidente qu'il n'est pas vraiment nécessaire de le mentionner, mais pour la régression par corrélation ou linéaire, le quatuor d'Anscombe est un choix logique. Bien que ce ne soit pas une histoire réelle avec des données réelles, je pense que c’est un exemple si simple qu’il pourrait raisonnablement s’intégrer à vos critères.
la source
StatSci.org est une bonne source pour les jeux de données.
la source
Un bel article intitulé Découverte des ressources pour l’enseignement des statistiques a permis de mieux comprendre ce sujet.
la source
https://tuvalabs.com
Je suis sûr que vous avez trouvé ce que vous cherchiez depuis longtemps, mais pour tous ceux qui découvrent un fil conducteur - TuvaLabs est une bonne source pour les jeux de données de Classrooms. Il gère des ensembles de données, une histoire, une description, de petits exercices et des capacités de visualisation. Vous pouvez également demander des ensembles de données à ce sujet.
la source