Je viens donc de terminer la lecture d'un excellent livre Introduction to Empirical Bayes . Je pensais que le livre était génial, mais construire des prieurs à partir des données me semblait mal. J'ai appris que vous proposez un plan d'analyse, puis vous collectez des données, puis vous testez l'hypothèse que vous avez précédemment déterminée dans votre plan d'analyse. Lorsque vous effectuez une analyse sur des données qui ont déjà été collectées, cela vous met dans une inférence post-sélective où vous devez être beaucoup plus strict sur ce que vous appelez "significatif", voir ici . Je pense que l'apprentissage automatique a quelque chose d'analogue qui s'appelle "la sélection des cerises", ce qui signifie choisir des prédicteurs avant de configurer des ensembles de tests et de formation ( Introduction à l'apprentissage statistique ).
Compte tenu de ce que j'ai appris précédemment, il me semble que les Bayes empiriques sont basés sur une base faible. Les gens l'utilisent-ils uniquement dans les paramètres où les données ont été générées de manière passive? Si c'est le cas, cela peut être justifié, mais il ne semble pas correct de l'utiliser lors d'une conception expérimentale rigoureuse, mais je sais que Brad Efron utilise des Bayes empiriques spécifiquement pour la biostatistique, généralement un domaine très NHST.
Mes questions sont:
- Comment les Bayes empiriques sont-ils valables?
- Dans quelles situations est-il utilisé?
- Dans quelles situations éviter d'utiliser l'approche empirique Bayes et pourquoi?
- Les gens l'utilisent-ils dans des domaines autres que la biostatistique et si oui, dans quelles situations l'utilisent-ils?
Réponses:
Je pense qu'il est important de se rappeler que différentes méthodes sont bonnes pour différentes choses, et les tests de signification ne sont pas tout ce qu'il y a dans le monde des statistiques.
1 et 3) EB n'est probablement pas une procédure de test d'hypothèse valide, mais elle n'est pas non plus censée l'être.
La validité peut être beaucoup de choses, mais vous parlez de conception expérimentale rigoureuse, nous discutons donc probablement d'un test d'hypothèse qui est censé vous aider à prendre la bonne décision avec une certaine fréquence à long terme. Il s'agit d'un régime strictement dichotomique de type oui / non qui est surtout utile pour les personnes qui doivent prendre une décision de type oui / non. Il y a en effet beaucoup de travail classique à ce sujet par des gens très intelligents. Ces méthodes ont une belle validité théorique dans la limite en supposant que toutes vos hypothèses se vérifient, etc. Cependant, EB n'était certainement pas destiné à cela. Si vous voulez la machinerie des méthodes NHST classiques, respectez les méthodes NHST classiques.
2) EB est mieux appliqué dans les problèmes où vous estimez de nombreuses quantités variables similaires.
Efron lui-même ouvre son livre Large-Scale Inference énumérant trois époques distinctes de l'histoire des statistiques, soulignant que nous sommes actuellement dans
Il poursuit:
L'application récente la plus réussie d'EB est peut
limma
-être disponible sur Bioconductor . Il s'agit d'un ensemble R avec des méthodes pour évaluer l'expression différentielle (c'est-à-dire des puces à ADN) entre deux groupes d'étude à travers des dizaines de milliers de gènes. Smyth montre que leurs méthodes EB produisent une statistique t avec plus de degrés de liberté que si vous deviez calculer des statistiques t génétiques régulières. L'utilisation d'EB ici "équivaut à un rétrécissement des variances estimées de l'échantillon vers une estimation groupée, résultant en une inférence beaucoup plus stable lorsque le nombre de tableaux est petit", ce qui est souvent le cas.Comme Efron le souligne ci-dessus, cela ne ressemble en rien à ce pour quoi NHST classique a été développé, et le cadre est généralement plus exploratoire que confirmatoire.
4) En règle générale, vous pouvez voir EB comme une méthode de retrait, et il peut être utile partout que le retrait est utile
limma
Plus les quantites à estimer sont similaires, plus il est probable que le retrait soit utile. Le livre auquel vous faites référence utilise les taux de réussite au baseball. Morris (1983) signale une poignée d'autres applications:
Ce sont tous des problèmes d'estimation parallèle et, autant que je sache, ils visent davantage à faire une bonne prédiction de ce qu'est une certaine quantité qu'à déterminer une décision oui / non.
Quelques références
la source