Existe-t-il un «standard» pour la notation des modèles statistiques?

10

Dans, par exemple, le manuel BUGS ou le prochain livre de Lee et Wagenmakers ( pdf ) et dans de nombreux autres endroits, un type de notation est utilisé qui me semble très flexible en ce qu'il peut être utilisé pour décrire succinctement la plupart des modèles statistiques. Un exemple de cette notation est le suivant:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

qui décrirait un modèle logistique hiérarchique sans prédicteurs, mais avec groupes. Cette façon de décrire les modèles semble fonctionner aussi bien pour décrire les modèles fréquentistes et bayésiens, par exemple, pour rendre cette description de modèle entièrement bayésienne, il vous suffirait d'ajouter des priors sur et .i=1nμpσp

Ce type de notation / formalisme de modèle est-il décrit en détail dans un article ou un livre?

Si vous souhaitez utiliser cette notation pour écrire des modèles, il existe de nombreuses façons de faire les choses et ce serait vraiment utile avec un guide complet à suivre et à référencer. J'ai trouvé quelques différences dans la façon dont les gens utilisent ce type de notation:

  • Comment appelez-vous les distributions? Par exemple, j'ai vu , etc.N,N,Norm,Normal
  • Comment gérez-vous les index? Par exemple, j'ai vu , , , etc.yijyi[j]yj|i
  • Quels symboles de paramètres sont généralement utilisés pour les paramètres. Par exemple, il est courant d'utiliser comme moyenne pour la distribution normale, mais qu'en est-il des autres distributions? (Pour cela, je vérifie généralement les distributions de Wikipedia )μ

Question de suivi: cette notation a-t-elle un nom? (Faute d'un meilleur nom, je l'ai appelé la convention centrée sur la distribution de probabilité dans un article de blog que j'ai écrit ...)

Rasmus Bååth
la source

Réponses:

2

Certaines normes recommandées pour la notation statistique sont présentées dans Halperin, Hartley et Hoel (1965) et Sanders et Pugh (1972) . La plupart de la notation actuelle provient de conventions qui ont été établies par les statisticiens biométriques à la fin du 19e siècle et au début du 20e siècle (la plupart ont été faites par Pearson et Fisher et leurs associés). L'économiste John Aldrich tient ici une liste utile des premières utilisations de la notation , et un compte rendu historique de l'école biométrique anglaise est publié dans Aldrich (2003) . (Si vous avez d'autres questions sur ce sujet, Aldrich est probablement l'expert vivant le plus important au monde dans l'histoire de la notation en statistique.)

Mis à part ce travail explicite, il y a beaucoup de livres qui donnent des introductions au domaine, et ceux-ci prennent soin de définir une notation cohérente avec les conventions courantes, définissant la notation au fur et à mesure. Il existe de nombreuses conventions bien connues dans ce domaine qui parcourent régulièrement la littérature, et les statisticiens les connaissent bien par la pratique, même sans avoir lu les recommandations de ces chercheurs.

Ambiguïté de la notation centrée sur la distribution: L'utilisation de la notation "centrée sur la distribution" est une convention standard qui est utilisée dans toute la littérature statistique. Cependant, une chose intéressante à souligner à propos de cette notation est qu'il y a un peu de marge de manœuvre quant à ce qu'elle signifie réellement. La convention standard consiste à lire l'objet à droite de ces déclarations comme une sorte de description d'une mesure de probabilité (par exemple, une fonction de distribution, une fonction de densité, etc.), puis à lire lerelation avec le sens "... a une distribution ..." ou "... a une mesure de probabilité ...", etc. Selon cette interprétation, la relation compare deux ensembles distincts de choses; l'objet sur le côté gauche est une variable aléatoire et l'objet sur le côté droit est une description d'une mesure de probabilité.

Cependant, il est également valable d'interpréter le côté droit comme une référence à une variable aléatoire (par opposition à une distribution) et de lire la relation comme signifiant "... a la même distribution que ..." . Selon cette interprétation, la relation est une relation d'équivalence comparant des variables aléatoires; les objets de gauche et de droite sont tous deux des variables aléatoires et la relation est réflexive, symétrique et transitive.

Cela donne deux interprétations possibles (et tout aussi valides) d'une déclaration comme:

XN(μ,σ2).
  • Interprétation distributionnelle: " a une distribution de probabilité ". Cette interprétation considère ce dernier objet comme une description d'une mesure de probabilité normale (par exemple, sa fonction de densité, sa fonction de distribution, etc.).XN(μ,σ2)

  • Interprétation des variables aléatoires: " a la même distribution de probabilité que ". Cette interprétation considère ce dernier objet comme une variable aléatoire normale.XN(μ,σ2)

Chaque interprétation a ses avantages et ses inconvénients. L'avantage de l'interprétation des variables aléatoires est qu'elle utilise le symbole standard pour faire référence à une relation d'équivalence , mais son inconvénient est qu'elle nécessite une référence à des variables aléatoires avec une notation similaire à leurs fonctions de distribution. L'avantage de l'interprétation distributionnelle est qu'elle utilise une notation similaire pour les distributions dans leur ensemble et leurs formes fonctionnelles avec une valeur d'argument donnée; l'inconvénient est qu'il utilise le symbole d'une manière qui n'est pas une relation d'équivalence.


Aldrich, J. (2003) The Language of the English Biometric School International Statistical Review 71 (1) , pp. 109-131.

Halperin, M., Hartley, HO et Hoel, PG (1965) Normes recommandées pour les symboles statistiques et la notation . The American Statistician 19 (3) , p. 12-14.

Sanders, JR et Pugh, RC (1972) Recommandation pour un ensemble standard de symboles et de notations statistiques . Chercheur pédagogique 1 (11) , p. 15-16.

Ben - Réintègre Monica
la source