Que faut-il enseigner en premier: la probabilité ou les statistiques?

19

Je viens de rejoindre en tant que membre du corps professoral dans un département de mathématiques. d'une institution réputée. J'enseignerai le cours Probabilités et Statistiques au premier cycle. L'établissement a déjà un programme pour ce cours dont je ne suis pas très satisfait. Dans ce programme, les statistiques sont couvertes en premier, et une partie d'estimation est également manquante. J'ai toujours pensé que les bases de la probabilité devraient être enseignées avant d'enseigner les statistiques. Quelqu'un peut-il donner une opinion à ce sujet? Une suggestion concernant les sujets qui devraient être abordés dans un tel cours est également très appréciée.

Ashok
la source
3
Il me semble qu'une compréhension de base (pas nécessairement des concepts trop mathématiques) de la probabilité est nécessaire pour obtenir la logique et l'intuition derrière les techniques statistiques comme en témoigne le fait que la plupart des livres de statistiques de niveau élémentaire commencent par la probabilité. Dans ma classe de premier cycle en entreprise, nous avons d'abord appris la probabilité, puis les statistiques.
rsl
4
Est-ce des statistiques théoriques ou appliquées ..? Une grande partie des statistiques appliquées peut être pensée sans introduction détaillée à la probabilité. Cela pourrait également être un bon apéritif pour les statistiques de probabilité et théoriques plus tard. Il ne faut donc pas que ce soit une si mauvaise idée.
Tim
3
Quel (s) programme (s) d'études les étudiants suivent-ils? S'agit-il de majors en mathématiques ou le module est-il proposé principalement à des étudiants d'autres départements, par exemple la sociologie ou les affaires?
Robert Long
@RobertLong: On dit que la mécanique engg. les étudiants et nos propres étudiants en mathématiques participeront au cours. D'autres de l'économie électrique engg. et des étudiants en informatique pourraient également y assister.
Ashok

Réponses:

22

Cela ne semble plus être une question d'opinion: le monde semble être allé bien au-delà du traditionnel «enseigner la probabilité puis enseigner la statistique comme application». Pour avoir une idée de l'orientation de l'enseignement des statistiques, consultez la liste des titres papier dans l'édition spéciale de The American Statistician de l'année dernière (reproduite ci-dessous): aucun d'entre eux ne fait référence à la probabilité.

Ils discutent de l'enseignement des probabilités et de son rôle dans le curriculum. Un bon exemple est le document de George Cobb et ses réponses . Voici quelques citations pertinentes:

La pratique statistique moderne est beaucoup plus large que ne le reconnaît notre accent traditionnel sur la déduction fondée sur les probabilités.

Ce que nous enseignons accuse des décennies de retard sur ce que nous pratiquons. Notre paradigme curriculaire met l'accent sur l'inférence formelle à partir d'une orientation fréquentiste, basée soit sur le théorème de la limite centrale au niveau d'entrée, soit, dans le cours pour les majors en mathématiques, sur un petit ensemble de modèles de probabilité paramétriques qui se prêtent à des solutions de forme fermée dérivées du calcul . L'écart entre notre curriculum d'un demi-siècle et notre pratique statistique contemporaine continue de se creuser.

Ma thèse ... est qu'en tant que profession, nous avons seulement commencé à explorer les possibilités. L'histoire de notre sujet soutient également cette thèse: contrairement à la probabilité, rejeton des mathématiques, la statistique a germé de novo du sol de la science.

La probabilité est un concept notoirement glissant. L'écart entre l'intuition et le traitement formel peut être plus large que dans toute autre branche des mathématiques appliquées. Si nous insistons sur le fait que la réflexion statistique doit nécessairement être basée sur un modèle de probabilité, comment concilier cette exigence avec les objectifs de rendre les idées centrales «simples et accessibles» et de minimiser les «conditions préalables à la recherche»?

En tant qu'expérience de pensée, parcourez les concepts de base et la théorie de l'estimation. Notez comment presque tous peuvent être expliqués et illustrés en utilisant uniquement le calcul du premier semestre, avec une probabilité introduite en cours de route.

Bien sûr, nous voulons que les étudiants apprennent le calcul et la probabilité, mais ce serait bien si nous pouvions rejoindre toutes les autres sciences pour enseigner les concepts fondamentaux de notre matière aux étudiants de première année.

Il y a beaucoup plus comme ça. Vous pouvez le lire vous-même; le matériel est disponible gratuitement.

Les références

Le numéro spécial de l'American Statistician on "Statistics and the Undergraduate Curriculum" (novembre 2015) est disponible sur http://amstat.tandfonline.com/toc/utas20/69/4 .

Enseigner à la prochaine génération d'étudiants en statistique à «penser avec les données»: numéro spécial sur les statistiques et le programme de premier cycle Nicholas J. Horton et Johanna S. Hardin DOI: 10.1080 / 00031305.2015.1094283

La simple rénovation est trop peu trop tard: nous devons repenser notre programme de premier cycle à partir de la base George Cobb DOI: 10.1080 / 00031305.2015.1093029

Statistiques pédagogiques à l'échelle de Google Nicholas Chamandy, Omkar Muralidharan & Stefan Wager pages 283-291 DOI: 10.1080 / 00031305.2015.1089790

Explorations dans la recherche statistique: une approche pour exposer les étudiants de premier cycle à l'analyse de données authentiques Deborah Nolan & Duncan Temple Lang DOI: 10.1080 / 00031305.2015.1073624

Au-delà de la normale: préparer les étudiants de premier cycle à la main-d'oeuvre dans une pierre angulaire de consultation statistique Byran J. Smucker & A. John Bailer DOI: 10.1080 / 00031305.2015.1077731

Un cadre pour infuser des expériences de données authentiques dans les cours de statistique Scott D. Grimshaw DOI: 10.1080 / 00031305.2015.1081106

Favoriser la compréhension conceptuelle en statistique mathématique Jennifer L. Green & Erin E. Blankenship DOI: 10.1080 / 00031305.2015.1069759

Le deuxième cours de statistique: conception et analyse d'expériences? Natalie J. Blades, G. Bruce Schaalje & William F. Christensen DOI: 10.1080 / 00031305.2015.1086437

Un cours de science des données pour les étudiants de premier cycle: penser avec les données Ben Baumer DOI: 10.1080 / 00031305.2015.1081105

La science des données dans les programmes d'études statistiques: préparer les étudiants à «penser avec les données» J. Hardin, R. Hoerl, Nicholas J. Horton, D. Nolan, B. Baumer, O. Hall-Holt, P. Murrell, R. Peng, P Roback, D. Temple Lang & MD Ward DOI: 10.1080 / 00031305.2015.1077729

Utilisation de simulations basées sur le jeu en ligne pour renforcer la compréhension des élèves sur les problèmes statistiques pratiques dans l'analyse des données du monde réel Shonda Kuiper & Rodney X. Sturdivant DOI: 10.1080 / 00031305.2015.1075421

Combattre la pensée anti-statistique en utilisant des méthodes basées sur la simulation tout au long du programme d'études de premier cycle Nathan Tintle, Beth Chance, George Cobb, Soma Roy, Todd Swanson et Jill VanderStoep DOI: 10.1080 / 00031305.2015.1081619

Ce que les enseignants devraient savoir sur le bootstrap: le rééchantillonnage dans le programme de statistique de premier cycle Tim C. Hesterberg DOI: 10.1080 / 00031305.2015.1089789

Intégration d'études de cas de conseil statistique dans les cours d'introduction de séries chronologiques Davit Khachatryan DOI: 10.1080 / 00031305.2015.1026611

Élaboration d'un nouveau programme de premier cycle en analyse computationnelle interdisciplinaire: une approche qualitative-quantitative-qualitative Ecosse Leman, Leanna House et Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

Des lignes directrices du curriculum aux résultats d'apprentissage: évaluation au niveau du programme Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Évaluation de programme pour une statistique de premier cycle Major Allison Amanda Moore et Jennifer J. Kaplan DOI: 10.1080 / 00031305.2015.1087331

whuber
la source
3
(+1) Je pense que c'est une excellente réponse. Le problème avec l'enseignement de la théorie des probabilités d'abord, c'est qu'elle donne l'impression que les statistiques concernent la spécification, l'ajustement et le diagnostic des modèles probabilistes. Non seulement ce n'est qu'une petite partie des statistiques, mais il ignore certains des problèmes les plus élémentaires lorsque l'on pense aux données: comment les visualiser et comment les résumer. Quels sont les mérites relatifs de la moyenne ou de la médiane pour identifier l'emplacement d'un ensemble de données? Comment devrions-nous croiser nos résultats? Quels graphiques sont appropriés et que nous disent-ils sur les données?
Silverfish
@Silverfish, c'est tellement différent de la façon dont des gars comme Bernoulli ont abordé les statistiques. Jetez un oeil à ce beau papier de son essai d'une nouvelle analyse de la mortalité causée par la variole et des avantages de l'inoculation pour la prévenir . Il a essentiellement commencé l'épidémiologie moderne avec cela. S'il était obsédé par les choses que vous mentionnez comme la visualisation, etc., il n'aurait pas apporté la compréhension de la compréhension du processus sous-jacent.
Aksakal
@Aksakal Je ne dis pas que la modélisation n'est pas importante, ni qu'une bonne dose de théorie des probabilités n'est pas vitale. Mais les statistiques sont plus larges que cela. Je pense que c'est une erreur de considérer la théorie des probabilités comme fondamentale: ou dans la mesure où elle l'est, cela signifie qu'elle doit être enseignée en premier. On peut voir des nombres irrationnels comme ou pour la première fois au lycée, mais ils ne les introduisent pas via des coupes Dedekind! Comprendre les données est quelque chose de largement accessible aux étudiants sans formation en mathématiques, et trouver des modèles est plus important que la soupe à valeur p. π2π
Silverfish
Pour les premières percées en épidémiologie, je vais vous présenter l'étude de John Snow sur l' épidémie de choléra de Broad Street en 1854 - quelque chose que l'on trouve dans de nombreux bons livres introduisant la visualisation des données, et dont les processus de réflexion doivent sûrement appartenir au cœur de Statistiques 101.
Silverfish
1
@Aksakal J'apprécie votre mention de Bernoulli. Cependant, la façon dont les pionniers et les grands mathématiciens abordent et résolvent les problèmes est tout autre chose que la façon dont les solutions doivent être enseignées. Je tiens à souligner que personne (afaik) ne préconise de ne pas enseigner la probabilité: la question concerne le moment où de telles idées devraient être introduites dans le programme d'introduction (collégial) et dans quelle mesure elles devraient être poursuivies. Il y a de fortes raisons pédagogiques (fondées sur la psychologie ainsi que sur l'expérience pédagogique) pour introduire d'abord de nombreuses idées statistiques.
whuber
7

Le pluriel d'anecdote n'est pas des données, mais dans presque tous les cours que j'ai vus, au moins les bases de la probabilité passent avant les statistiques.

D'un autre côté, historiquement, les moindres carrés ordinaires ont été développés avant que la distribution normale ne soit découverte! La méthode statistique est venu d' abord, plus rigoureuse, la justification basée sur la probabilité de la raison pour laquelle il travaille a terminé deuxième!

L' histoire de la statistique de Stephen Stigler : mesure de l'incertitude avant 1900 guide le lecteur à travers le développement historique:

  • Les mathématiciens, les astronomes ont compris la mécanique de base et la loi de la gravité. Ils pourraient décrire le mouvement des corps célestes en fonction de plusieurs paramètres.
  • Ils ont également eu des centaines d'observations des corps célestes, mais comment les observations devraient-elles être combinées pour récupérer les paramètres?
    • Une centaine d'observations vous donne cent équations, mais s'il n'y a que trois inconnues à résoudre, c'est un système surdéterminé ...
  • Legendre a été le premier à développer la méthode de minimisation de la somme de l'erreur quadratique. Plus tard, cela a été lié au travail sur la probabilité de Gauss et Laplace, que les moindres carrés ordinaires étaient en quelque sorte optimaux compte tenu des erreurs normalement distribuées.

Pourquoi est-ce que j'évoque cela?

Il y a une certaine élégance logique pour d'abord construire la machinerie mathématique nécessaire pour dériver, comprendre une méthode, pour jeter les bases avant de construire la maison.

Dans la réalité de la science cependant, la maison vient souvent en premier, la fondation en second: P.

J'adorerais voir les résultats de la littérature sur l'éducation. Quoi de plus efficace pour l'enseignement? Et alors pourquoi? Ou pourquoi alors quoi?

(Je suis peut-être un bizarre, mais j'ai trouvé l'histoire de la façon dont les moindres carrés ont été développés pour être un tourneur de pages passionnant! Les histoires peuvent rendre les choses autrement ennuyeuses et abstraites prendre vie ...)

Matthew Gunn
la source
2
La littérature sur l'éducation statistique semble cohérente et sans équivoque à ce sujet: la probabilité n'est pas des statistiques, les statistiques sont bien plus que des probabilités, et les statistiques (au moins aux niveaux K-12 et collégial) devraient être introduites comme une réflexion avec des données plutôt que comme une application de probabilité. En plus des références que j'ai fournies dans ma réponse, consultez d'autres ressources librement disponibles telles que CauseWeb , GAISE et J. Statistics Education .
whuber
4

Je pense que cela devrait être un processus itératif pour la plupart des gens: vous apprenez un peu de probabilité, puis un peu de statistiques, puis un peu plus de probabilité, et un peu plus de statistiques, etc.

Par exemple, jetez un œil aux exigences de la PhD Stat chez GWU. Le cours de probabilité de doctorat 8257 a la brève description suivante:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Notez comment il a des cours de statistiques de niveau Master 6201 et 6202 dans les pré-requis. Si vous descendez au cours de statistiques ou de probabilités le plus bas de GWU, vous obtiendrez Introduction aux statistiques économiques et commerciales 1051 ou Introduction aux statistiques en sciences sociales 1053 . Voici la description de l'un d'eux:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Remarquez, comment le cours a un titre "Statistiques" mais il enseigne une probabilité en son sein. Pour beaucoup, c'est la première rencontre avec la théorie des probabilités après le cours "Stats" du lycée.

C'est un peu similaire à la façon dont il était enseigné à l'époque: les cours et les manuels étaient généralement intitulés "Théorie des probabilités et statistiques mathématiques", par exemple le texte de Gmurman .

Je ne peux pas imaginer étudier la théorie des probabilités sans aucune statistique. Le cours de doctorat supérieur à 8257 suppose que vous connaissez déjà les statistiques. Donc, même si vous enseignez d'abord la probabilité, il y aura un apprentissage de la statistique. C'est juste pour le premier cours qu'il est probablement judicieux de peser un peu plus sur les statistiques et de l'utiliser pour introduire la théorie des probabilités également.

En fin de compte, c'est un processus itératif comme je l'ai décrit au début. Et comme dans tout bon processus itératif, la première étape n'est pas importante, que le tout premier concept provienne des statistiques ou de la probabilité n'aura plus d'importance après plusieurs itérations: vous arriverez au même endroit malgré tout.

Note finale, l'approche pédagogique dépend de votre domaine. Si vous étudiez la physique, vous obtiendrez des choses comme la mécanique statistique, les statistiques de Fermi-Dirac, que vous n'allez pas traiter en sciences sociales. De plus, en physique, les approches fréquentistes sont naturelles et, en fait, elles sont à la base de certaines théories fondamentales. Par conséquent, il est logique d'avoir une théorie des probabilités autonome enseignée dès le début, contrairement aux sciences sociales où il n'est peut-être pas très logique d'y consacrer du temps et de peser davantage sur les statistiques.

Aksakal
la source
2
Un programme de doctorat, à première vue, semble fournir peu de conseils sur la façon d'enseigner une matière aux étudiants de premier cycle. Les objectifs et le public sont complètement différents. J'ajouterai une note personnelle: dans mes interactions avec certains départements de statistiques établis, j'ai vu que le programme reflète des idées de pédagogie et de progression vieilles de 30 ans et continuera de le faire jusqu'à ce qu'une nouvelle génération de professeurs prenne le relais. Peut-être devrions-nous nous efforcer d'utiliser ces programmes comme modèles normatifs de ce qui devrait être fait.
whuber
1
@whuber Et puis le programme reflétera alors des idées vieilles de 30 ans ... mais au moins ce ne seront pas des idées vieilles de 60 ans. Quoi qu'il en soit, comme on dit, la science avance, funérailles par funérailles.
Mark L. Stone