Mon père est un passionné de mathématiques mais peu intéressé par les statistiques. Il serait judicieux d' essayer d'illustrer quelques-unes des merveilleuses statistiques, et le CLT est un candidat de choix. Comment pourriez-vous transmettre la beauté mathématique et l'impact du théorème de la limite centrale à un non-statisticien?
33
Réponses:
Ce que j'ai le plus aimé avec le CLT, ce sont les cas où cela ne s'applique pas - cela me donne l'espoir que la vie est un peu plus intéressante que la courbe de Gauss ne le suggère. Alors montrez-lui la distribution de Cauchy.
la source
Pour bien apprécier le CLT, il faut le voir.
D'où la notion de machine à haricot et de nombreuses vidéos youtube pour illustration.
la source
Souvent, lorsque les mathématiciens parlent de probabilité, ils commencent par une distribution de probabilité connue, puis parlent de probabilité d’événements. La vraie valeur du théorème central limite est qu'il nous permet d'utiliser la distribution normale comme approximation dans les cas où nous ne connaissons pas la distribution vraie. Vous pouvez poser à votre père une question statistique standard (mais sous forme mathématique) sur la probabilité que la moyenne d'un échantillon soit supérieure à une valeur donnée si les données proviennent d'une distribution avec moyenne mu et sd sigma, puis voir si il suppose une distribution (que vous dites ensuite que nous ne savons pas) ou dit qu'il a besoin de connaître la distribution. Ensuite, vous pouvez montrer que nous pouvons approximer la réponse en utilisant le CLT dans de nombreux cas.
Pour comparer les mathématiques aux statistiques, j'aime utiliser le théorème d'intégration de la valeur moyenne (qui dit que pour une intégrale de a à b, il existe un rectangle de a à b de même surface et que la hauteur du rectangle est la moyenne des courbe). Le mathématicien examine ce théorème et dit "cool, je peux utiliser une intégration pour calculer une moyenne", tandis que le statisticien examine le même théorème et dit "cool, je peux utiliser une moyenne pour calculer une intégrale".
En fait, j'ai dans mon bureau des tentures murales aux points de croix représentant le théorème de la valeur moyenne et le CLT (ainsi que le théorème de Bayes).
la source
J'aime montrer la variation de l'échantillonnage et essentiellement le théorème de la limite centrale au moyen d'un exercice "en classe". Tous les élèves de la classe de 100 étudiants écrivent leur âge sur un bout de papier. Tous les morceaux de papier ont la même taille et sont pliés de la même manière après avoir calculé la moyenne. C'est la population et je calcule l'âge moyen. Ensuite, chaque élève choisit au hasard 10 morceaux de papier, note les âges et les remet dans le sac. Il calcule la moyenne et passe le sac à l'élève suivant. Finalement, nous avons 100 échantillons de 10 étudiants, chacun estimant la moyenne de la population que nous pouvons décrire à l'aide d'un histogramme et de statistiques descriptives.
Nous répétons ensuite la démonstration cette fois en utilisant un ensemble de 100 "opinions" qui reproduisent certaines questions Oui / Non de récents sondages, par exemple, si l'élection (du général britannique) était appelée demain, envisageriez-vous de voter pour le Parti national britannique. Les étudiants échantillonnent 10 de ces opinions.
À la fin, nous avons démontré la variation d'échantillonnage, le théorème central de limite, etc. avec des données continues et binaires.
la source
Jouer avec le code suivant, faire varier la valeur
M
et choisir des distributions autres que l’uniforme peut être une illustration amusante.la source
Si vous utilisez Stata, vous pouvez utiliser la commande -clt- qui crée des graphiques de distributions d'échantillonnage, voir
http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm
la source
D'après mon expérience, le CLT est moins utile qu'il n'y paraît. Au milieu d'un projet, on ne sait jamais si n est suffisamment grand pour que l'approximation soit adaptée à la tâche. Et pour les tests statistiques, le CLT vous aide à protéger l’erreur de type I, mais ne fait rien pour enrayer l’erreur de type II. Par exemple, le test t peut avoir une puissance arbitrairement basse pour n grand lorsque la distribution des données est extrêmement asymétrique.
la source