Après être tombé sur le concept dans un manuel de statistiques, j'ai essayé d'en comprendre la tête, et je suis finalement arrivé à une conclusion qui semble correspondre à toutes les explications que j'ai vues jusqu'à présent: un intervalle crédible est ce que les non-statisticiens pensent qu'une confiance l'intervalle est.
Digression pour ceux comme moi il y a une heure qui ne connaissent pas la différence
Si nous avons observé des données et en avons prédit un paramètre, disons la moyenne , l'intervalle crédible est l'intervalle [ μ min , μ max ] pour lequel nous sommes sûrs à 95% que mu tombe à l'intérieur (ou un nombre autre que 95%, si nous utilisions un autre niveau). L'intervalle de confiance enseigné dans les classes de statistiques d'introduction peut chevaucher l'intervalle crédible, mais ne se chevauchent pas toujours bien. Si vous voulez braver l'explication, essayez de lire ceci et cette question sur Cross Validated; ce qui m'a finalement aidé à comprendre, après de nombreuses égratignures, c'est cette réponse .
Cela signifie-t-il qu'il serait scientifiquement préférable d'utiliser un intervalle crédible sur un intervalle de confiance dans mes résultats? Si oui, pourquoi n'ai-je pas vu de publications l'utilisant?
- Est-ce parce que le concept doit être utilisé, mais les scientifiques de la mesure n'ont pas encore rattrapé les bonnes méthodes statistiques?
- Ou la signification de l'intervalle de confiance d'origine est-elle mieux adaptée pour expliquer les résultats d'études empiriques?
- Ou est-ce qu'en pratique, ils se chevauchent si souvent que cela n'a pas d'importance du tout?
- Le choix dépend-il de la distribution statistique que nous supposons pour nos données? Peut-être qu'avec une distribution gaussienne, elles se chevauchent toujours numériquement, donc personne en dehors des statistiques pures ne se soucie de la différence (de nombreuses études que j'ai lues ne prennent même pas la peine de calculer n'importe quel type d'intervalle, et peut-être environ 1% donnent de l'espace à la pensée que leurs données pourraient ne pas être distribuées normalement).
- Cela dépend-il de notre position de théorie scientifique? Par exemple, il semble que l'intervalle de confiance devrait être utilisé dans le travail positiviste et l'intervalle crédible dans le travail interprétiviste, mais je ne suis pas sûr que ce sentiment soit correct.
Réponses:
Le type d'intervalle indique le type de méthode que vous avez utilisé. Si un intervalle crédible (ou une variante bayésienne), cela signifie qu'une méthode bayésienne a été utilisée. Si un intervalle de confiance, alors une méthode fréquentiste a été utilisée.
Re: Ou est-ce qu'en pratique, ils se chevauchent si souvent que cela n'a pas d'importance du tout? Aussi longtemps que
les intervalles crédibles et de confiance seront proches les uns des autres. La raison: la probabilité dominera l'a priori bayésien, et la probabilité est ce qui est généralement utilisé dans les méthodes fréquentistes.
Je suggère de ne pas s'inquiéter de savoir quoi utiliser. Si vous voulez un préalable informatif, assurez-vous d'utiliser une méthode bayésienne. Sinon, choisissez une méthode et un contexte appropriés (fréquentiste ou bayésien), vérifiez que les conditions requises pour appliquer la méthode sont raisonnablement remplies (si importantes mais si rarement faites!), Puis continuez si la méthode est appropriée pour le type de données.
la source