Certaines normes recommandées pour la notation statistique sont présentées dans Halperin, Hartley et Hoel (1965) et Sanders et Pugh (1972) . La plupart de la notation actuelle provient de conventions qui ont été établies par les statisticiens biométriques à la fin du 19e siècle et au début du 20e siècle (la plupart ont été faites par Pearson et Fisher et leurs associés). L'économiste John Aldrich tient ici une liste utile des premières utilisations de la notation , et un compte rendu historique de l'école biométrique anglaise est publié dans Aldrich (2003) . (Si vous avez d'autres questions sur ce sujet, Aldrich est probablement l'expert vivant le plus important au monde dans l'histoire de la notation en statistique.)
Mis à part ce travail explicite, il y a beaucoup de livres qui donnent des introductions au domaine, et ceux-ci prennent soin de définir une notation cohérente avec les conventions courantes, définissant la notation au fur et à mesure. Il existe de nombreuses conventions bien connues dans ce domaine qui parcourent régulièrement la littérature, et les statisticiens les connaissent bien par la pratique, même sans avoir lu les recommandations de ces chercheurs.
Ambiguïté de la notation centrée sur la distribution: L'utilisation de la notation "centrée sur la distribution" est une convention standard qui est utilisée dans toute la littérature statistique. Cependant, une chose intéressante à souligner à propos de cette notation est qu'il y a un peu de marge de manœuvre quant à ce qu'elle signifie réellement. La convention standard consiste à lire l'objet à droite de ces déclarations comme une sorte de description d'une mesure de probabilité (par exemple, une fonction de distribution, une fonction de densité, etc.), puis à lire le∼relation avec le sens "... a une distribution ..." ou "... a une mesure de probabilité ...", etc. Selon cette interprétation, la relation compare deux ensembles distincts de choses; l'objet sur le côté gauche est une variable aléatoire et l'objet sur le côté droit est une description d'une mesure de probabilité.
Cependant, il est également valable d'interpréter le côté droit comme une référence à une variable aléatoire (par opposition à une distribution) et de lire la relation comme signifiant "... a la même distribution que ..." . Selon cette interprétation, la relation est une relation d'équivalence comparant des variables aléatoires; les objets de gauche et de droite sont tous deux des variables aléatoires et la relation est réflexive, symétrique et transitive.∼
Cela donne deux interprétations possibles (et tout aussi valides) d'une déclaration comme:
X∼N(μ,σ2).
Interprétation distributionnelle: " a une distribution de probabilité ". Cette interprétation considère ce dernier objet comme une description d'une mesure de probabilité normale (par exemple, sa fonction de densité, sa fonction de distribution, etc.).XN(μ,σ2)
Interprétation des variables aléatoires: " a la même distribution de probabilité que ". Cette interprétation considère ce dernier objet comme une variable aléatoire normale.XN(μ,σ2)
Chaque interprétation a ses avantages et ses inconvénients. L'avantage de l'interprétation des variables aléatoires est qu'elle utilise le symbole standard pour faire référence à une relation d'équivalence , mais son inconvénient est qu'elle nécessite une référence à des variables aléatoires avec une notation similaire à leurs fonctions de distribution. L'avantage de l'interprétation distributionnelle est qu'elle utilise une notation similaire pour les distributions dans leur ensemble et leurs formes fonctionnelles avec une valeur d'argument donnée; l'inconvénient est qu'il utilise le symbole d'une manière qui n'est pas une relation d'équivalence.∼∼
Aldrich, J. (2003) The Language of the English Biometric School International Statistical Review 71 (1) , pp. 109-131.
Halperin, M., Hartley, HO et Hoel, PG (1965) Normes recommandées pour les symboles statistiques et la notation . The American Statistician 19 (3) , p. 12-14.
Sanders, JR et Pugh, RC (1972) Recommandation pour un ensemble standard de symboles et de notations statistiques . Chercheur pédagogique 1 (11) , p. 15-16.