D'où vient la fonction gaussienne?

9

J'ai lu d'innombrables pages sur Google et je ne trouve pas de réponse satisfaisante. J'ai également lu http://castatistics.wikispaces.com/file/view/normal+der..pdf , mais je doute que c'était la motivation d'origine de la fonction gaussienne. Je suis actuellement étudiant de premier cycle et mon manuel me dit simplement que la fonction f (x) = ae - (x - b) ^ 2 / c est utilisée comme fonction de densité de probabilité pour une courbe normale. Mais mon manuel ne me donne aucune idée de l'origine de cette fonction. Quelle était la motivation originale pour le développement d'une telle fonction? Quelqu'un peut-il s'il vous plaît offrir une preuve que je peux réellement comprendre avec des étapes clairement étiquetées? J'ai une compréhension du calcul de base et je suis un débutant en matière de statistiques. S'il vous plaît pas de preuves compliquées.

Andrew Kudwitt
la source
2
En réponse à une question très similaire, j'ai proposé stats.stackexchange.com/a/3904 , que vous pourriez trouver utile. À proprement parler, il ne répond pas à votre question sur la "motivation": cela est venu plusieurs générations après de Moivre, avec le développement par Gauss de la méthode des moindres carrés.
whuber

Réponses:

4

La distribution normale est la distribution qui est attendue lorsque les mesures sont faites à partir d'un grand nombre de composants de «bruit» qui sont tous distribués de la même manière les uns que les autres.

Le principe est parfois illustré par un exemple utilisant des dés. Lancez un dé un grand nombre de fois et tracez la distribution des valeurs. En supposant que le dé est juste, vous vous retrouverez avec une distribution uniforme (discrète) de 1 à 6. Maintenant, recommencez mais utilisez deux dés. Vous obtenez une distribution triangulaire pas à pas de 2 à 12. Ajoutez un troisième dé et la distribution est un peu en forme de cloche et les étapes sont petites car il y a maintenant 17 valeurs différentes possibles. Avec quatre dés, la distribution ressemble beaucoup à une distribution normale, et avec un nombre infini de dés, c'est une distribution normale. Quelque part entre quatre et un nombre infini de dés (je dis souvent 12) sont nécessaires pour une distribution qui, à des fins pratiques, ne se distingue pas de la distribution normale donnée par la formule normale.

De nombreuses mesures biologiques et physiques ont de nombreuses sources d'inexactitude et de bruit et donc les distributions de ces mesures seront approximativement normales, tant que les distributions de ces composants sont similaires. Si une composante de bruit est beaucoup plus grande que les autres, la distribution normale ne se produira pas. Imaginez que si un mort sur une douzaine avait des visages marqués de 100 à 600 plutôt que de 1 à 6. Ce dé dominerait les onze autres et donc la distribution de la somme de leurs faces supérieures serait un mélange évident de (discret) uniforme 100 à 600 et un presque continu presque normal 11 à 66. Les distributions des variations des composants doivent être similaires, même si elles n'ont pas besoin d'être normales (elles n'ont pas besoin d'être même presque normales s'il y a un beaucoup d'entre eux).

(Il convient de noter que de nombreuses sources de variabilité ont une distribution logarithmique et que de nombreuses mesures en biologie et en physique sont plus proches de la log-normale que la normale.)

Michael Lew
la source