Dans les statistiques fréquentistes, un intervalle de confiance à 95% est une procédure produisant un intervalle qui, si elle était répétée un nombre infini de fois, contiendrait le vrai paramètre 95% du temps. Pourquoi est-ce utile?
Les intervalles de confiance sont souvent mal compris. Ce n'est pas un intervalle dans lequel nous pouvons être sûrs à 95% que le paramètre est (sauf si vous utilisez l'intervalle de crédibilité bayésien similaire). Les intervalles de confiance me semblent être un appât et un changement.
Le seul cas d'utilisation auquel je peux penser est de fournir la plage de valeurs pour laquelle nous ne pouvons pas rejeter l'hypothèse nulle selon laquelle le paramètre est cette valeur. Les valeurs p ne fourniraient-elles pas cette information, mais mieux? Sans être aussi trompeur?
En bref: pourquoi avons-nous besoin d'intervalles de confiance? Comment sont-ils, lorsqu'ils sont correctement interprétés, utiles?
la source
Réponses:
Sortir du paradigme fréquentiste et marginaliser au-dessus de pour toute distribution antérieure donne le résultat de probabilité marginale correspondant (le plus faible):θ
Une fois que nous avons fixé les limites de l'intervalle de confiance en fixant les données à , nous ne faisons plus appel à cette déclaration de probabilité, car nous avons maintenant fixé les données. Cependant, si l'intervalle de confiance est traité comme un intervalle aléatoire, nous pouvons en effet faire cette déclaration de probabilité --- c'est-à-dire qu'avec la probabilité le paramètre tombera dans l'intervalle (aléatoire).X=x 1 - α θ1−α θ
Dans les statistiques fréquentistes, les énoncés de probabilité sont des énoncés sur les fréquences relatives au cours d'essais répétés à l'infini. Mais cela est vrai de chaque énoncé de probabilité dans le paradigme fréquentiste, donc si votre objection concerne les énoncés de fréquence relative, ce n'est pas une objection spécifique aux intervalles de confiance. Si nous sortons du paradigme fréquentiste, alors nous pouvons légitimement dire qu'un intervalle de confiance contient son paramètre cible avec la probabilité souhaitée, tant que nous faisons cette déclaration de probabilité de manière marginale (c'est-à-dire non conditionnelle aux données) et que nous traitons donc l'intervalle de confiance dans son sens aléatoire.
Je ne sais pas pour les autres, mais cela me semble être un résultat de probabilité assez puissant et une justification raisonnable pour cette forme d'intervalle. Je suis moi-même plus partisan des méthodes bayésiennes, mais les résultats de probabilité soutenant les intervalles de confiance (dans leur sens aléatoire) sont des résultats puissants qui ne doivent pas être reniflés.
la source
Je suis d'accord avec @Ben ci-dessus, et j'ai pensé que je fournirais un exemple simple où un intervalle bayésien par rapport à un fréquenciste serait utile dans la même circonstance.
Imaginez une usine avec des lignes d'assemblage parallèles. Il est coûteux d'arrêter une ligne, et en même temps, ils veulent produire des produits de qualité. Ils sont préoccupés par les faux positifs et les faux négatifs au fil du temps. Pour l'usine, c'est un processus de moyenne: à la fois la puissance et la protection garantie contre les faux positifs comptent. Les intervalles de confiance, ainsi que les intervalles de tolérance, sont importants pour l'usine. Néanmoins, les machines se désaligneront, c'est-à-dire , et les équipements de détection observeront des événements parasites. Le résultat moyen est important tandis que le résultat spécifique est un détail opérationnel.θ≠Θ
À l'opposé, un seul client achète un seul produit ou un seul lot de produits. Ils ne se soucient pas des propriétés de répétition de la chaîne de montage. Ils se soucient du seul produit qu'ils ont acheté. Imaginons que le client soit la NASA et qu'il ait besoin que le produit réponde à une spécification, disons Ils ne se soucient pas de la qualité des pièces qu'ils n'ont pas achetées. Ils ont besoin d'un intervalle bayésien d'une certaine forme. De plus, un seul échec pourrait tuer de nombreux astronautes et coûter des milliards de dollars. Ils doivent savoir que chaque pièce achetée est conforme aux spécifications. La moyenne serait mortelle. Pour une fusée Saturn V, un taux de défaut de 1% aurait impliqué 10 000 pièces défectueuses lors des vols Apollo. Ils ont nécessité 0% de défauts sur toutes les missions.γ≤Γ.
Vous vous inquiétez d'avoir un intervalle de confiance lorsque vous travaillez dans l'espace échantillon comme le fait une usine. Il crée l'espace échantillon. Vous vous inquiétez des intervalles crédibles lorsque vous travaillez dans l'espace des paramètres, comme le ferait un client. Si vous ne vous souciez pas des observations en dehors de la vôtre, alors vous êtes bayésien. Si vous vous souciez des échantillons qui n'ont pas été vus, mais qui auraient pu être vus, alors vous êtes un Frequentist.
Êtes-vous préoccupé par la moyenne à long terme ou l'événement spécifique?
la source
Notez que par la définition stricte de l'intervalle de confiance, il est possible qu'ils soient complètement dénués de sens, c'est-à-dire non informatifs sur le paramètre d'intérêt. Cependant, dans la pratique, ils sont généralement très significatifs.
À titre d'exemple d'intervalle de confiance sans signification, supposons que j'ai une procédure qui produit 95% du temps et 5% du temps [ , ], où sont n'importe quelle paire de variables aléatoires telles que . Ensuite, il s'agit d'une procédure qui capture toute probabilité au moins 95% du temps, donc techniquement un intervalle de confiance valide pour toute probabilité. Pourtant, si je dis que l'intervalle produit par cette procédure est pour un donné , vous devez vous rendre compte que vous n'avez vraiment rien appris sur .[0,1] Umin Umax Umin,Umax Umin<Umax [0.01,0.011] p p
D'un autre côté, la plupart des intervalles de confiance sont construits de manière plus utile. Par exemple, si je vous ai dit qu'il a été créé à l'aide d'une procédure d'intervalle de Wald, alors nous savons que
où est l'erreur standard. Ceci est une déclaration très significative sur la façon dont rapporte à . Transformer cela en un intervalle de confiance est simplement une tentative de simplifier ce résultat pour quelqu'un qui n'est pas si familier avec les distributions normales. Cela ne veut pas seulement dire que ce n'est qu'un outil pour les personnes qui ne connaissent pas les distributions normales; par exemple, le bootstrap centile est un outil pour résumer l'erreur entre l'estimateur et le vrai paramètre lorsque la distribution de cette erreur peut être non gaussienne.se p pp^ p
la source
Les intervalles de confiance sont non seulement utiles, mais essentiels dans certains domaines, comme la physique. Malheureusement, le plus de bruit concernant les IC provient des Bayésiens pris dans de faux débats avec les Frequentistes, généralement dans le contexte des "sciences" sociales et d'autres disciplines de type scientifique.
Supposons que je mesure une quantité en physique, telle que la charge électrique. Je lui fournirais toujours la mesure de l'incertitude de la valeur, qui est généralement un écart-type. Puisque, en physique, les erreurs sont souvent gaussiennes, cela se traduit directement en CI. Cependant, lorsque les erreurs ne sont pas gaussiennes, cela devient un peu compliqué, certaines intégrales doivent être évaluées, etc. Rien de trop ésotérique cependant en général.
Voici une brève présentation sur l'IC en physique des particules et la définition:
Notez qu'en physique, les «expériences répétées» ont souvent une signification littérale: on suppose que vous pouvez réellement répéter des expériences dans le papier et observer cette fraction. Ainsi, l'IC a presque une signification littérale pour vous et n'est qu'un moyen d'exprimer les informations sur l'incertitude de la mesure. Ce n'est pas une expérience de pensée, pas une opinion subjective, ni vos sentiments ni mes sentiments concernant les probabilités, etc.
la source
Ce fil est devenu rapidement le débat Frequentist vs Bayesian, et cela n'est pas facile à résoudre. Les mathématiques dans les deux approches sont solides, donc cela revient toujours aux préférences philosophiques. L'interprétation fréquentiste de la probabilité comme limite de la fréquence relative d'un événement est justifiée par la loi forte des grands nombres; quelle que soit votre interprétation préférée de la probabilité, la fréquence relative d'un événement convergera vers sa probabilité avec la probabilité 1.
Les intervalles de confiance fréquentistes sont en effet plus difficiles à interpréter que les intervalles crédibles bayésiens. En traitant une quantité inconnue comme une variable aléatoire, les Bayésiens peuvent affirmer qu'un intervalle contient cette quantité avec une certaine probabilité. Les fréquencistes refusent de traiter certaines quantités comme des variables aléatoires, et toute équation ne contenant que des constantes ne peut être vraie ou fausse. Ainsi, lors de l'estimation d'une constante inconnue, les fréquentistes doivent les lier avec un intervalle aléatoire pour impliquer la probabilité. Plutôt qu'un seul intervalle contenant une variable aléatoire avec une certaine probabilité, une méthode fréquentiste génère de nombreux intervalles possibles différents, dont certains contiennent la constante inconnue. Si la probabilité de couverture est raisonnablement élevée, c'est un acte de foi raisonnable d'affirmer qu'un intervalle particulier contient la constante inconnue (notez "
Un Bayésien rechignerait à un tel acte de foi autant qu'un Frequentist rechigne à traiter toute quantité inconnue comme une variable aléatoire. La méthode de construction fréquentiste Neyman a en fait révélé un problème embarrassant avec de tels sauts de foi. Sans l'empêcher activement (voir Feldman et Cousins, 1997 pour une approche), les résultats rares peuvent générer des intervalles de confiance VIDE pour un paramètre de distribution. Un tel acte de foi serait très déraisonnable! J'ai vu quelques bayésiens utiliser cet exemple pour se moquer des méthodes fréquentistes, tandis que les fréquentistes répondent généralement par "eh bien, j'ai toujours un intervalle correct la plupart du temps, et sans faire de fausses hypothèses". Je soulignerai que l'impasse bayésienne / fréquentiste n'est pas importante pour la plupart des personnes qui appliquent leurs méthodes.
la source