Lorsque vous enseignez les statistiques, utilisez «normal» ou «gaussien»?

42

J'utilise principalement "distribution gaussienne" dans mon livre, mais quelqu'un vient de suggérer que je passe à "distribution normale". Un consensus sur quel terme utiliser pour les débutants?

Bien sûr, les deux termes sont des synonymes , il ne s'agit donc pas d'une question de fond, mais uniquement du terme le plus couramment utilisé. Et bien sûr, j'utilise les deux termes. Mais lequel devrait être utilisé principalement?

Harvey Motulsky
la source
1
Y a-t-il une section d'aperçu / un exemple de chapitre de votre livre disponible quelque part? J'entends de bonnes choses à ce sujet.
Glen_b
2
@Glen_b La fonctionnalité "Regarder à l'intérieur" d'Amazon.com vous permet de prévisualiser le livre. En outre, trois chapitres sont disponibles ici: intuitivebiostatistics.com/excerpts
Harvey Motulsky
6
La question de "quel terme est le plus couramment utilisé" peut être facilement résolue, bien que grossièrement: une recherche sur Google de la distribution "gaussienne" contient environ les deux tiers des résultats d'une recherche de "distribution normale". Le rapport est un peu différent sur Google Scholar, où maintenant "distribution gaussienne" a deux fois moins de résultats de "distribution normale" (mais seulement un quart lorsque "inverse" est exclu). Ces résultats suggèrent que (1) "normal" est plus populaire mais (2) "gaussien" est largement reconnu. L'examen des résultats suggère que des expressions telles que "asymptotiquement normal" peuvent prendre longtemps, voire jamais, pour être remplacées.
whuber
2
En prolongement de @whuber, je pense qu'il y a aussi une différence entre les domaines: "gaussien" semble être relativement plus prédominant en science, alors que "normal" semble être le terme normal en sciences sociales ...
abaumann
1
Essayez "anormal": P
Mehrdad

Réponses:

47

Même si j'ai tendance à dire «normal» plus souvent (puisque c'est ce que l'on m'avait appris lors du premier apprentissage), je pense que «gaussien» est un meilleur choix, à condition que les étudiants / lecteurs connaissent bien les deux termes:

  • La normale n'est pas particulièrement typique, le nom est donc trompeur. Il joue certes un rôle important (notamment à cause du CLT), mais les données observées sont beaucoup moins souvent, en particulier près de la Gaussienne, que ce qui est parfois suggéré.

  • Le mot (et les mots associés tels que "normaliser") a plusieurs significations qui peuvent être pertinentes en statistique (considérons "base orthonormée" par exemple). Si quelqu'un dit "j'ai normalisé mon échantillon", je ne peux pas dire avec certitude s'il est passé à la normalité, aux scores z calculés, au vecteur à la longueur unitaire, à la longueur ou à un certain nombre d'autres possibilités. Si nous avons tendance à appeler la distribution "gaussienne" au moins, la première option est éliminée et remplacée par un élément plus descriptif.n

  • Gauss a au moins un degré raisonnable de droits sur la distribution.

Glen_b
la source
3
+1 pour le bit "tant que les étudiants / lecteurs connaissent bien les deux termes". Je pense que ce serait un mauvais service pour les étudiants d'enseigner uniquement le "gaussien", simplement parce que le mot "normal" est si répandu.
Patrick Coulombe
6
Je conviens qu'il faut enseigner les deux. Si nous partions de zéro et savions ce que nous savons maintenant, nous ne permettions jamais à "normal" d'émerger, car (1) le terme est surchargé de toute façon (2) la normale (gaussienne) n'est pas normale (habituelle ou attendue) de données. "Gaussian" est l'alternative la plus commune, même s'il existe une histoire avant Gauss. ET Jaynes a suggéré «central», ce qui est une drôle d’idée, mais elle n’a pas fait son chemin. (Je reconnais les arguments basés sur le théorème de la limite centrale.)
Nick Cox
En ce qui concerne la puce n ° 2, s’agissant de la science au sens large et des mathématiques dans leur ensemble, il n’est pas nécessairement évident de savoir si " normal " ou " Gauss " est plus courant. ;-)
cardinal
@ cardinal - Je suis tout à fait d'accord avec la suggestion selon laquelle le terme "gaussien" a tendance à être beaucoup plus orienté - et j'ajouterais également l'ingénierie.
Glen_b
1
@Glen_b: d'accord. (Dans mon modèle mental, j'inclue l'ingénierie sous le parapluie général de la science, bien que ce soit peut-être un peu en dehors de la, euh, norme.) :-)
cardinal
36

Je voudrais utiliser le gaussien.

Les personnes qui étudient les statistiques sont confrontées au problème suivant: nous utilisons des mots anglais de tous les jours pour signifier différentes choses (pouvoir, significatif, distribution, etc.). Dans la mesure où nous pouvons minimiser cela, nous devrions le faire. "Normal" a déjà beaucoup de significations.

Peter Flom - Rétablir Monica
la source
2
Peter: Je suis d'accord. C'est pourquoi j'ai toujours utilisé "gaussien". Mais un commentaire d'un critique sur la nouvelle édition (concise), a fortement poussé "normal".
Harvey Motulsky
25

N(μ,σ2)NG(μ,σ2)

Nate Eldredge
la source
1
GΓGaussGaussianBernoullibinomialbinomN
N
8
GN(μ,σ2)
1
N(μ,σ2)
10

En allemand, il s’appelle souvent Gaußsche Normalverteilung , il est donc pratiquement impossible d’entrer en conflit facilement.

Serait-il approprié pour vous de combiner gaussien et normal ?

gismo141
la source
8
Peut gnormal- être travaillera en anglais!
Dilip Sarwate
2
@DilipSarwate 𝅘𝅥𝅮 Je suis un gnormal, contre gnormal 𝅘𝅥𝅮 (excuses à MM. Flanders et Swann)
hobbs
9

Selon l' encyclopédie Wolfram :

Alors que statisticiens et mathématiciens utilisent uniformément le terme "distribution normale" pour désigner cette distribution, les physiciens l'appellent parfois une distribution gaussienne et, en raison de sa forme évasée et courbée, les spécialistes des sciences sociales l'appellent "courbe en cloche".

Je conviens qu'il est plus facile de confondre «normal» - pourtant, je soupçonne que les livres de statistiques utilisent habituellement «normal».

Gerenuk
la source
+1 pour une réponse descriptive plutôt que normative. Je suis en fait d’accord avec les autres réponses selon lesquelles le gaussien est préférable, quel que soit le domaine, mais il est instructif de partir du contexte de l’usage répandu.
R ..
En ce qui concerne l'expression "courbe en cloche", je l'éviterais entièrement dans n'importe quel contexte d'enseignement. Le tristement célèbre ouvrage du même nom évoque des accents très racistes. Les étudiants qui en sont conscients risquent d'être distraits et d'associer ce que vous dites à des théories absurdes sur la supériorité raciale plutôt que d'avoir le sujet est autonome.
R ..
@R .. Descriptif, oui, mais cette description est directement contredite par les réponses fournies, qui indiquent qu’une fraction significative des statisticiens et mathématiciens utilise le terme "gaussien".
David Richerby
Une autre raison de ne pas utiliser le terme "courbe de cloche" pour désigner la (fonction de densité de) la distribution gaussienne / normale est qu'il existe de nombreuses distributions dont la fonction de densité de probabilité (pdf) ressemble à une courbe de cloche. Même le pdf d'une distribution de Cauchy ressemble à une courbe en cloche!
Mico
+1 pour expliquer les termes relatifs dans différentes disciplines. Merci!
Enthusiast
7

J'aimerais souligner que S. Stigler utilise la distribution Normal / Gauss / Laplace-Gauss pour prouver la "loi de Stigler de l'éponyme" publiée dans Statistics on the Table (certaines pages sont disponibles sur books.google ).

Ce qui est particulièrement intéressant et pertinent à propos de cette question, c’est que, aux pages 287 à 288, il y a des tableaux de l’utilisation historique de «Normal» contre «Gauss» contre «Laplace» et qu’il semble qu’au fil des ans, l’utilisation est passée de 2:15 à normal en 1816-1884 à 8h14 (1888-1917) à 5h17 (1919-1939) à 9h10 (1947-1976).

Donc, selon cela, l'utilisation de «normal» vs «Gauss» devient plus égale. Ou si vous croyez que la tendance se poursuivra, alors «Gauss» battra la normale dans 50 à 100 ans.

peser
la source
5

Une réponse que je n'ai pas encore vue parmi toutes les bonnes réponses:

J'utilise principalement "normal" pour des raisons de familiarité antérieure, mais j'aime le mettre en valeur pour souligner son sens technique: "... si les données sont normalement distribuées ..." (je ne sais pas si j'ai copié cette pratique depuis quelque part ailleurs ou (ré) inventé moi-même)

Ben Bolker
la source
5

Lequel à utiliser dépend du niveau de statistiques enseigné. Malheureusement, mon expérience en enseignement indique que la majorité des étudiants de premier cycle ne comprennent jamais complètement le concept de distribution de probabilité. Cependant, ils doivent tous, d'une manière ou d'une autre, s'attaquer au CLT et aux moyens de réfléchir à l'incertitude. Normal est préférable pour une classe de premier cycle, car il n'ajoute pas l'angoisse d'un nouveau mot inconnu. Pour les étudiants diplômés, le gaussien est préféré en raison de la confusion évoquée ci-dessus au sujet de la normalisation et du contexte historique qu’elle fournit. J'enseigne un cours de recherche de premier cycle exigeant deux cours de statistiques préalables et tous les livres de premier cycle que j'ai vus utilisés au cours des 30 dernières années utilisent Normal.

TJ Olney
la source
1
"la majorité des étudiants de premier cycle ne comprennent jamais complètement le concept de distribution de probabilité" +1
Guru Code
4

Le nom normalprovient de certaines des observations selon lesquelles les erreurs se comportent normalement. Vous trouverez plus de détails ici . Si telle est la raison pour appeler cette distribution une distribution normale, cela peut créer une nouvelle confusion en tant que distribution normale pour le nombre d'accidents poisson. Je crois que nous devrions aller de l'avant et commencer à l'appeler Gaussianplutôt.

Mahbubul Majumder
la source