J'ai récemment passé en revue quelques vieux articles de Nancy Reid, Barndorff-Nielsen, Richard Cox et, oui, un petit Ronald Fisher sur le concept de "l'inférence conditionnelle" dans le paradigme fréquentiste, ce qui semble signifier que les inférences sont basées en considérant uniquement les "sous-ensemble pertinent" de l'espace d'échantillonnage, et non pas de l'ensemble de l'espace d'échantillonnage.
À titre d'exemple clé, il est connu que les intervalles de confiance basés sur la statistique t peuvent être améliorés (Goutis et Casella, 1992) si l'on considère également le coefficient de variation de l'échantillon (appelé statistique auxiliaire).
En tant que personne qui utilise régulièrement l'inférence basée sur la probabilité, j'ai supposé que lorsque je forme un intervalle de confiance % asymptotique, j'effectue une inférence conditionnelle (approximative), car la probabilité est conditionnelle à l'échantillon observé.
Ma question est que, à part la régression logistique conditionnelle, je n'ai pas vu beaucoup d'utilité de l'idée de conditionner sur les statistiques auxiliaires avant l'inférence. Ce type d'inférence est-il limité aux familles exponentielles, ou porte-t-il un autre nom de nos jours, de sorte qu'il ne semble que limité.
J'ai trouvé un article plus récent (Spanos, 2011) qui semble mettre sérieusement en doute l'approche adoptée par l'inférence conditionnelle (c.-à-d. L'ancillarité). Au lieu de cela, il propose la suggestion très sensée et moins alambiquée mathématiquement que l'inférence paramétrique dans les cas "irréguliers" (où le support de la distribution est déterminé par les paramètres) peut être résolue en tronquant la distribution d'échantillonnage inconditionnelle habituelle.
Fraser (2004) a donné une belle défense de la conditionnalité, mais j'ai toujours le sentiment que plus qu'un peu de chance et d'ingéniosité sont nécessaires pour appliquer réellement l'inférence conditionnelle à des cas complexes ... certainement plus complexe que d'invoquer le chi carré approximation de la statistique du rapport de vraisemblance pour l'inférence conditionnelle "approximative".
Welsh (2011, p. 163) a peut-être répondu à ma question (3.9.5, 3.9.6).
Ils soulignent le résultat bien connu de Basu (le théorème de Basu) selon lequel il peut y avoir plus d'une statistique auxiliaire, ce qui soulève la question de savoir quel "sous-ensemble pertinent" est le plus pertinent. Pire encore, ils montrent deux exemples où, même si vous avez une statistique auxiliaire unique, cela n'élimine pas la présence d'autres sous-ensembles pertinents.
Ils concluent ensuite que seules les méthodes bayésiennes (ou des méthodes équivalentes) peuvent éviter ce problème, permettant une inférence conditionnelle sans problème.
Les références:
- Spanos, Aris. "Revisiter le modèle uniforme de Welch: Un cas pour l'inférence conditionnelle?." Advances and Applications in Statistical Science 5 (2011): 33-52.
- Fraser, DAS "Auxiliaires et inférence conditionnelle". Statistical Science 19.2 (2004): 333-369.
- Welsh, Alan H. Aspects of inference statistique . Vol. 916. John Wiley & Sons, 2011.
la source
Réponses:
Il semble, en effet, que l'inférence basée sur la vraisemblance est conditionnelle, lorsqu'une telle statistique auxiliaire existe. Je l'ai obtenu de la p.197 de "In All Likelihood" de Yudi Pawitan:
Conclusion: ** Probabilité des données∝ probabilité basée sur un modèle conditionnel **
la source