C'est un problème de la "7e Olympiade des étudiants de Kolmogorov en théorie des probabilités":
Étant donné une observation d'une distribution avec les deux paramètres inconnus, donner un intervalle de confiance pour avec un niveau de confiance d'au moins 99%.Normal ( μ , σ 2 ) σ 2
Il me semble que cela devrait être impossible. J'ai la solution, mais je ne l'ai pas encore lue. Des pensées?
Je posterai la solution dans quelques jours.
[Modification de suivi: solution officielle publiée ci-dessous. La solution de Cardinal est plus longue, mais donne un meilleur intervalle de confiance. Merci également à Max et Glen_b pour leur contribution.]
probability
normal-distribution
confidence-interval
variance
Jonathan Christensen
la source
la source
Réponses:
Vu sous l'angle des inégalités de probabilité et des liens avec le cas d'observation multiple, ce résultat pourrait ne pas sembler si impossible, ou, du moins, il pourrait sembler plus plausible.
Soit avec et inconnu. On peut écrire pour .μ σ 2 X = σ Z + μ Z ∼ N ( 0 , 1 )X∼N(μ,σ2) μ σ2 X=σZ+μ Z∼N(0,1)
Une raison d'optimisme
Rappelons que dans le cas , avec , l' intervalle de confiance typique pour est où est quantile -level d'un chi-carré avec degrés de liberté. Ceci, bien sûr, est valable pour tout . Bien que ce soit l' intervalle le plus populaire (appelé intervalle de queue égale pour des raisons évidentes), ce n'est ni le seul ni même celui de la plus petite largeur! Comme il doit être évident, une autre sélection valable est T = ∑ n i = 1 ( X i - ˉ Xn ≥ 2 ( 1 - α ) σ 2 ( TT= ∑ni = 1( Xje- X¯)2 ( 1 - α ) σ2 q k , a
Depuis, , puis également une couverture d'au moins . ( 0 , ∑ n i = 1 X 2 iT≤ ∑ni = 1X2je ( 1 - α )
Vu sous cet angle, nous pourrions alors être optimistes que l'intervalle dans la revendication principale est vrai pour . La principale différence est qu'il n'y a pas de distribution de chi carré à zéro degré de liberté dans le cas d'une observation unique, nous devons donc espérer que l'utilisation d'un quantile à un degré de liberté fonctionnera.n = 1
Un demi-pas vers notre destination ( Exploiter la queue droite )
Avant de plonger dans une preuve de la revendication principale, examinons d'abord une revendication préliminaire qui n'est pas aussi solide ou satisfaisante statistiquement, mais donne peut-être un aperçu supplémentaire de ce qui se passe. Vous pouvez passer à la preuve de la réclamation principale ci-dessous, sans perte (le cas échéant) importante. Dans cette section et dans la suivante, les preuves, bien que légèrement subtiles, ne reposent que sur des faits élémentaires: la monotonie des probabilités et la symétrie et l'unimodalité de la distribution normale.
Réclamation auxiliaire : est un intervalle de confiance pour tant que . Ici est le quantile de niveau d'une normale standard.( 1 - α ) σ 2[ 0 , X2/ z2α) ( 1 - α ) σ2 z α αα > une / deux zα α
Preuve . etpar symétrie, donc dans ce qui suit on peut prendre sans perte de généralité. Maintenant, pour et , et donc avec , nous voyons que Cela ne fonctionne que pour , car c'est ce qui est nécessaire pour .| σ Z + μ | d = | - σ Z + μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 P ( | X | > θ ) ≥| X| = | -X| | σZ+ μ | =ré| -σZ+ μ | μ≥0 θ≥0 μ≥0 θ = z α σ P ( 0 ≤ σ
Cela prouve la revendication subsidiaire. Bien qu'illustratif, il n'est pas satisfaisant d'un point de vue statistique car il nécessite un absurdement grand pour fonctionner.α
Prouver la demande principale
Un raffinement de l'argument ci-dessus conduit à un résultat qui fonctionnera pour un niveau de confiance arbitraire. Tout d'abord, notez que Définissez et . Alors, Si nous pouvons montrer que le côté droit augmente en pour chaque fixe , alors nous pouvons utiliser un argument similaire à celui de l'argument précédent. Ceci est au moins plausible, car nous aimerions croire que si la moyenne augmente, il devient plus probable que nous voyons une valeur avec un module qui dépassea = μ / σ ≥ 0 b
Définissez . Alors Notez que et pour positif , diminue en . Maintenant, pour , il est facile de voir que . Ces faits pris ensemble impliquent facilement que pour tout et tout fixe .fb( a ) = Φ ( a - b )+Φ(−a−b)
Par conséquent, nous avons montré que pour et ,a≥0 b≥0
En décomposant tout cela, si nous prenons , nous obtenons ce qui établit la revendication principale.θ=qα−−√σ
Remarque finale : Une lecture attentive de l'argument ci-dessus montre qu'il utilise uniquement les propriétés symétriques et unimodales de la distribution normale. Par conséquent, l'approche fonctionne de façon analogue pour obtenir des intervalles de confiance à partir d'une seule observation à partir de n'importe quelle famille d'échelle de localisation unimodale symétrique, par exemple, les distributions de Cauchy ou de Laplace.
la source
Il est temps de faire un suivi! Voici la solution qui m'a été donnée:
L'intervalle de confiance (qui est très large) est légèrement conservateur en simulation, sans couverture empirique (dans 100 000 simulations) inférieure à 99,15% car j'ai fait varier le CV sur plusieurs ordres de grandeur.
À titre de comparaison, j'ai également simulé l'intervalle de confiance du cardinal. Je dois noter que l'intervalle du cardinal est un peu plus étroit - dans le cas de 99%, il finit par atteindre environ , contrairement au dans la solution fournie. La couverture empirique est juste au niveau nominal, là encore sur plusieurs ordres de grandeur pour le CV. Donc, son intervalle gagne définitivement.6300 X2 10000 X2
Je n'ai pas eu le temps de regarder attentivement le document publié par Max, mais je prévois de le regarder et je pourrais ajouter quelques commentaires à ce sujet plus tard (c'est-à-dire au plus tôt une semaine). Cet article revendique un intervalle de confiance à 99% de , qui a une couverture empirique légèrement inférieure (environ 98,85%) à la couverture nominale des grands CV dans mes brèves simulations.( 0 , 4900 X2)
la source
pchisq(1/4900,1,lower.tail=F)
R
0.9886
la source