Considérons le modèle de régression linéaire
,
,
.
Soit vs .H 1 : σ 2 0 ≠ σ 2
On peut en déduire que , où . Et est la notation typique de la matrice de l'annihilateur, , où est la variable dépendante régressé sur .Dim(X)=n×kMXMXy= y y yX
Le livre que je lis déclare ce qui suit:
J'ai déjà demandé quels critères utiliser pour définir une région de rejet (RR), voir les réponses à cette question , et la principale était de choisir le RR qui a rendu le test le plus puissant possible.
Dans ce cas, l'alternative étant une hypothèse composite bilatérale, il n'y a généralement pas de test UMP. De plus, par la réponse donnée dans le livre, les auteurs ne montrent pas s'ils ont fait une étude de la puissance de leur RR. Néanmoins, ils ont choisi un RR à deux queues. Pourquoi, puisque l'hypothèse ne détermine pas «unilatéralement» le RR?
Edit: Cette image est dans le manuel de solution de ce livre comme solution pour l'exercice 4.14.
la source
mathematical-statistics
. Donc, un bon q. OMI. C'est un peu large mais je pense qu'une bonne réponse passerait en revue diverses approches et considérations, et un exemple motivant aide beaucoup. (J'aurais choisi un exemple aussi simple que possible - des tests sur la variance d'une distribution normale avec une moyenne connue, ou la moyenne d'une distribution exponentielle.) [BTW J'oublie souvent de voter sur qs quand je les commente .]Réponses:
Il est plus facile de commencer par étudier le cas où les coefficients de régression sont connus et l'hypothèse nulle donc simple. Alors la statistique suffisante est , où est le résiduel; sa distribution sous le zéro est également un chi carré mis à l'échelle par & avec des degrés de liberté égaux à la taille de l'échantillon . z σ 2 0 nT=∑z2 z σ20 n
Notez le rapport des probabilités sous & et confirmez que c'est une fonction croissante de pour tout : σ = σ 2 T σ 2 > σ 1σ=σ1 σ=σ2 T σ2>σ1
Ainsi, selon le théorème de Karlin-Rubin, chacun des tests vs & vs est uniformément le plus puissant. Il n'y a clairement pas de test UMP de contre . Comme discuté ici , effectuer les deux tests unilatéraux et appliquer une correction de comparaisons multiples conduit au test couramment utilisé avec des régions de rejet de taille égale dans les deux queues, et c'est tout à fait raisonnable lorsque vous allez prétendre que ou que lorsque vous rejetez le null.H A : σ < σ 0 H 0 : σ = σ 0 H A : σ < σ 0 H 0 : σ = σ 0 H A : σ ≠ σ 0 σ > σ 0 σ < σ 0H0:σ=σ0 HA:σ<σ0 H0:σ=σ0 HA:σ<σ0 H0:σ=σ0 HA:σ≠σ0 σ>σ0 σ<σ0
Trouvez ensuite le rapport des probabilités sous , l'estimation de la probabilité maximale de , & : σ σ = σ 0σ=σ^ σ σ=σ0
Il s'agit d'une statistique fine pour quantifier dans quelle mesure les données prennent en charge sur . Et les intervalles de confiance formés en inversant le test du rapport de vraisemblance ont la propriété intéressante que toutes les valeurs de paramètres à l'intérieur de l'intervalle ont une probabilité plus élevée que celles à l'extérieur. La distribution asymptotique de deux fois le rapport log-vraisemblance est bien connue, mais pour un test exact, vous n'avez pas besoin d'essayer de déterminer sa distribution - utilisez simplement les probabilités de queue des valeurs correspondantes de dans chaque queue.HA:σ≠σ0 H0:σ=σ0 T
Si vous ne pouvez pas avoir un test uniformément le plus puissant, vous voudrez peut-être celui qui est le plus puissant contre les alternatives les plus proches de la valeur nulle. Trouvez la dérivée de la fonction log-vraisemblance par rapport à - la fonction score:σ
L'évaluation de son amplitude à donne un test localement le plus puissant de vs . Parce que la statistique de test est limitée ci-dessous, avec de petits échantillons, la région de rejet peut être confinée à la queue supérieure. Encore une fois, la distribution asymptotique du score au carré est bien connue, mais vous pouvez obtenir un test exact de la même manière que pour le TLR.σ0 H0:σ=σ0 HA:σ≠σ0
Une autre approche consiste à limiter votre attention aux tests impartiaux, à savoir ceux pour lesquels la puissance sous n'importe quelle alternative dépasse la taille. Vérifiez que votre statistique suffisante a une distribution dans la famille exponentielle; alors pour un test de taille , si ou , sinon , vous pouvez trouver le test sans biais le plus puissant en résolvantα ϕ(T)=1 T<c1 T>c2 ϕ(T)=0
Un graphique permet de montrer le biais dans le test des zones de queue égales et comment il se produit:
Aux valeurs de un peu plus de la probabilité accrue que les statistiques de test tombent dans le rejet de rejet de la queue supérieure ne compense pas la probabilité réduite de sa chute dans la région de rejet de la queue inférieure et la puissance de la test tombe en dessous de sa taille.σ σ0
Être impartial est bon; mais il ne va pas de soi qu'avoir une puissance légèrement inférieure à la taille sur une petite région de l'espace des paramètres au sein de l'alternative est si mauvais qu'il exclut complètement un test.
Deux des tests bilatéraux ci-dessus coïncident (dans ce cas, pas en général):
Je pense que tous, même les tests unilatéraux, sont admissibles, c'est-à-dire qu'il n'y a pas de test plus puissant ou aussi puissant sous toutes les alternatives - vous ne pouvez rendre le test plus puissant contre les alternatives dans un sens qu'en le rendant moins puissant contre les alternatives dans l'autre direction. Au fur et à mesure que la taille de l'échantillon augmente, la distribution du chi carré devient de plus en plus symétrique, et tous les tests bilatéraux finiront par être sensiblement les mêmes (une autre raison d'utiliser le test simple à queue égale).
Avec l'hypothèse nulle composite, les arguments deviennent un peu plus compliqués, mais je pense que vous pouvez obtenir pratiquement les mêmes résultats, mutatis mutandis. Notez que l'un mais pas l'autre des tests unilatéraux est UMP!
la source
Je ne sais pas si c'est vrai en général. Certes, beaucoup de résultats classiques (Neymon-Pearson, Karlin-Rubin) sont basés sur une hypothèse simple ou unilatérale, mais il existe des généralisations à l'hypothèse composite bilatérale. Vous pouvez trouver quelques notes à ce sujet ici , et plus de discussion dans le manuel ici .
Pour votre problème en particulier, je ne sais pas si un test UMP existe ou non. Mais intuitivement, il semble que sous une perte de 0-1, un test unilatéral sera probablement inadmissible, et donc la classe de test admissible sera tous les tests bilatéraux. Donner la classe de tests bilatéraux, le but est de trouver celui avec la plus grande puissance, ce qui devrait se produire automatiquement en choisissant des quantiles autour du mode unique du . (Tout cela est basé sur l'intuition).χ2
la source