Dois-je signaler des intervalles crédibles plutôt que des intervalles de confiance?

9

Après être tombé sur le concept dans un manuel de statistiques, j'ai essayé d'en comprendre la tête, et je suis finalement arrivé à une conclusion qui semble correspondre à toutes les explications que j'ai vues jusqu'à présent: un intervalle crédible est ce que les non-statisticiens pensent qu'une confiance l'intervalle est.


Digression pour ceux comme moi il y a une heure qui ne connaissent pas la différence

Si nous avons observé des données et en avons prédit un paramètre, disons la moyenne , l'intervalle crédible est l'intervalle [ μ min , μ max ] pour lequel nous sommes sûrs à 95% que mu tombe à l'intérieur (ou un nombre autre que 95%, si nous utilisions un autre niveau). L'intervalle de confiance enseigné dans les classes de statistiques d'introduction peut chevaucher l'intervalle crédible, mais ne se chevauchent pas toujours bien. Si vous voulez braver l'explication, essayez de lire ceci et cette question sur Cross Validated; ce qui m'a finalement aidé à comprendre, après de nombreuses égratignures, c'est cette réponse .μ[μmin, μmax]


Cela signifie-t-il qu'il serait scientifiquement préférable d'utiliser un intervalle crédible sur un intervalle de confiance dans mes résultats? Si oui, pourquoi n'ai-je pas vu de publications l'utilisant?

  • Est-ce parce que le concept doit être utilisé, mais les scientifiques de la mesure n'ont pas encore rattrapé les bonnes méthodes statistiques?
  • Ou la signification de l'intervalle de confiance d'origine est-elle mieux adaptée pour expliquer les résultats d'études empiriques?
  • Ou est-ce qu'en pratique, ils se chevauchent si souvent que cela n'a pas d'importance du tout?
  • Le choix dépend-il de la distribution statistique que nous supposons pour nos données? Peut-être qu'avec une distribution gaussienne, elles se chevauchent toujours numériquement, donc personne en dehors des statistiques pures ne se soucie de la différence (de nombreuses études que j'ai lues ne prennent même pas la peine de calculer n'importe quel type d'intervalle, et peut-être environ 1% donnent de l'espace à la pensée que leurs données pourraient ne pas être distribuées normalement).
  • Cela dépend-il de notre position de théorie scientifique? Par exemple, il semble que l'intervalle de confiance devrait être utilisé dans le travail positiviste et l'intervalle crédible dans le travail interprétiviste, mais je ne suis pas sûr que ce sentiment soit correct.
rumtscho
la source
Les intervalles de confiance sont pour les intervalles fréquentistes et crédibles pour l'approche bayésienne. "pourquoi n'ai-je pas vu de publications qui l'utilisent?" il y en a plein (bayésien)
Theta30
5
À ce jour, il y a 154 articles sur PubMed mentionnant l' intervalle de crédibilité et 489 mentionnant l' intervalle crédible . Ils ne sont pas aussi communs que l'intervalle de confiance (179811 articles et comptage), mais c'est simplement parce que l'approche fréquentiste est la méthode dominante. Et oui, l'intervalle crédible semble génial, mais ce n'est vrai que si la distribution précédente est correctement spécifiée. Les démons sont tous dans les hypothèses.
Penguin_Knight
J'ai peut-être encore mélangé mes termes, mais dans mon manuel, l'auteur suggère d'utiliser un intervalle crédible lors de l'estimation de la moyenne des données binomiales en utilisant une estimation du maximum de vraisemblance basée sur une statistique de test dérivée des erreurs standard. Et je pense que c'est une approche fréquentiste. Y a-t-il peut-être une différence entre un intervalle crédible et un intervalle de confiance "probabilité de couverture réelle"?
rumtscho

Réponses:

4

Le type d'intervalle indique le type de méthode que vous avez utilisé. Si un intervalle crédible (ou une variante bayésienne), cela signifie qu'une méthode bayésienne a été utilisée. Si un intervalle de confiance, alors une méthode fréquentiste a été utilisée.

Re: Ou est-ce qu'en pratique, ils se chevauchent si souvent que cela n'a pas d'importance du tout? Aussi longtemps que

  • les conditions d'utilisation des méthodes sont raisonnablement remplies (par exemple, "l'indépendance des observations" est une exigence pour de nombreuses méthodes),
  • la méthode bayésienne n'utilise pas un préalable informatif,
  • l'échantillon qui n'est pas très petit, et
  • les modèles / méthodes sont analogues,

les intervalles crédibles et de confiance seront proches les uns des autres. La raison: la probabilité dominera l'a priori bayésien, et la probabilité est ce qui est généralement utilisé dans les méthodes fréquentistes.

Je suggère de ne pas s'inquiéter de savoir quoi utiliser. Si vous voulez un préalable informatif, assurez-vous d'utiliser une méthode bayésienne. Sinon, choisissez une méthode et un contexte appropriés (fréquentiste ou bayésien), vérifiez que les conditions requises pour appliquer la méthode sont raisonnablement remplies (si importantes mais si rarement faites!), Puis continuez si la méthode est appropriée pour le type de données.

OpenIntro
la source