J'aime beaucoup entendre des explications simples sur des problèmes complexes. Quelle est votre analogie ou anecdote préférée qui explique un concept statistique difficile?
Mon préféré est l' explication de Murray sur la cointégration utilisant un ivrogne et son chien. Murray explique comment deux processus aléatoires (une personne ivre errante et son chien, Oliver) peuvent avoir des racines unitaires tout en restant apparentés (co-intégrés) puisque leurs premières différences communes sont stationnaires.
L'ivrogne part du bar, sur le point de se promener sans but, de manière aléatoire. Mais périodiquement elle entonne "Oliver, où es-tu?", Et Oliver interrompt son errance sans but pour aboyer. Il l'entend; elle l'entend. Il pense: "Oh, je ne peux pas la laisser aller trop loin, elle va m'enfermer." Elle pense: "Oh, je ne peux pas le laisser aller trop loin; il me réveillera au milieu de la nuit avec ses aboiements." Chacun évalue à quelle distance se trouve l’autre et s’efforce de combler partiellement cet écart.
la source
J'ai déjà utilisé la promenade de l'ivrogne pour une promenade aléatoire, et l'ivresse et son chien pour la cointégration; ils sont très utiles (en partie parce qu'ils sont amusants).
L'un de mes exemples préférés est le Birthday Paradox ( entrée de Wikipédia ), qui illustre certains concepts importants de probabilité. Vous pouvez simuler cela avec une pièce remplie de monde.
Incidemment, je recommande fortement le livre "Enseigner les statistiques: quelques astuces" de Andrew Gelman pour quelques exemples de méthodes créatives pour enseigner les concepts statistiques (voir la table des matières ). Regardez également son article sur le cours qu’il enseigne sur l’enseignement des statistiques: "Un cours sur l’enseignement des statistiques au niveau universitaire" . Et sur "Enseigner Bayes aux étudiants diplômés en sciences politiques, sociologie, santé publique, éducation, économie, ..." .
Pour décrire les méthodes bayésiennes, utiliser une pièce injuste et la retourner plusieurs fois est une approche plutôt commune / efficace.
la source
J'aime montrer la variation de l'échantillonnage et essentiellement le théorème de la limite centrale au moyen d'un exercice "en classe". Tous les élèves de la classe de 100 étudiants écrivent leur âge sur un bout de papier. Tous les morceaux de papier ont la même taille et sont pliés de la même façon après avoir calculé la moyenne. Ceci est la population et je calcule l'âge moyen. Ensuite, chaque élève choisit au hasard 10 morceaux de papier, note les âges et les remet dans le sac. Il calcule la moyenne et passe le sac à l'élève suivant. Finalement, nous avons 100 échantillons de 10 étudiants, chacun estimant la moyenne de la population que nous pouvons décrire à l'aide d'un histogramme et de statistiques descriptives.
Nous répétons ensuite la démonstration cette fois en utilisant un ensemble de 100 "opinions" qui reproduisent certaines questions Oui / Non de récents sondages, par exemple, si l'élection (du général britannique) était appelée demain, envisageriez-vous de voter pour le Parti national britannique. Les étudiants échantillonnent 10 de ces opinions.
À la fin, nous avons démontré la variation d'échantillonnage, le théorème central de limite, etc. avec des données continues et binaires.
la source
Certainement le problème de Monty Hall. http://en.wikipedia.org/wiki/Monty_Hall_problem
la source
1) Une bonne démonstration de la façon dont le "hasard" doit être défini afin de calculer la probabilité de certains événements:
Quelle est la probabilité qu’une ligne aléatoire tirée d’un cercle soit plus longue que le rayon?
La question dépend totalement de la façon dont vous tracez votre ligne. Les possibilités que vous pouvez décrire de manière réelle pour un cercle dessiné sur le sol peuvent inclure:
Tracez deux points aléatoires dans le cercle et tracez une ligne à travers ceux-ci. (Voir où tombent deux mouches / pierres ...)
Choisissez un point fixe sur la circonférence, puis un point aléatoire ailleurs dans le cercle et rejoignez ceux-ci. (En fait, il s’agit de placer un bâton en travers du cercle à un angle variable en passant par un point donné et aléatoire, par exemple, lorsqu’une pierre tombe.)
Dessine un diamètre. Choisissez au hasard un point le long de celle-ci et tracez une perpendiculaire à travers celle-ci. (Faites rouler un bâton en ligne droite de manière à ce qu'il repose sur le cercle.)
Il est relativement facile de montrer à quelqu'un qui est capable de faire de la géométrie (mais pas nécessairement des statistiques) que la réponse à la question peut varier assez largement (d'environ 2/3 à environ 0,866).
3) Expliquer pourquoi un diagnostic médical peut sembler vraiment imparfait. Un test de dépistage de la maladie détectant avec précision 99,9% des personnes qui en sont atteintes mais un diagnostic de diagnostic faussement positif chez ceux qui ne le sont pas réellement peut sembler être très souvent faux lorsque la prévalence de la maladie est très faible ( par exemple 1 sur 1000), mais de nombreux patients en font l’objet.
C’est celui qui s’explique le mieux avec des chiffres réels - imaginons 1 million de personnes testées, donc 1 000 personnes ont la maladie, 999 sont correctement identifiées, mais 0,1% des 999 000 sont 999 à qui on dit qu’elles l’ont mais ne les ont pas. Donc, la moitié de ceux à qui on dit qu'ils l'ont, ne le font pas, malgré le haut niveau de précision (99,9%) et le faible nombre de faux positifs (0,1%). Un deuxième test (idéalement différent) séparera ensuite ces groupes.
[Incidemment, j'ai choisi les chiffres parce qu'ils sont faciles à utiliser. Bien entendu, ils ne doivent pas totaliser 100%, car les taux de précision / faux positif sont des facteurs indépendants du test.]
la source
Le livre de Sam Savage, Flaw of Averages, contient de bonnes explications profanes de concepts statistiques. En particulier, il a une bonne explication de l'inégalité de Jensen. Si le graphique de votre retour sur investissement est convexe, c'est-à-dire qu'il vous «sourit», alors le hasard est en votre faveur: votre rendement moyen est supérieur à votre rendement moyen.
la source
Dans les lignes de la moyenne comme point d'équilibre, j'aime bien cette vue de la médiane comme point d'équilibre:
la source
Behar et al. Ont une collection de 25 analogies pour l'enseignement des statistiques. Voici deux exemples:
D'autres exemples incluent
Les références
la source
Question amusante.
Quelqu'un a découvert que je travaillais dans la biostatistique et ils m'ont demandé (en gros) "Les statistiques ne sont-elles pas un moyen de mentir?"
(Ce qui ramène la citation de Mark Twain sur Lies, Damn Lies et Statistics.)
J'ai essayé d'expliquer que les statistiques permettent de dire avec une précision de 100% que, compte tenu des hypothèses et des données, la probabilité que telle ou telle chose soit exactement telle ou telle.
Elle n'a pas été impressionné.
la source