Quelles sont les propriétés statistiques «souhaitables» du test du rapport de vraisemblance?

11

Je lis un article dont la méthode est entièrement basée sur le test du rapport de vraisemblance. L'auteur dit que le test LR contre des alternatives unilatérales est UMP. Il procède en affirmant que

"... même quand il [le test LR] ne peut pas être démontré comme étant le plus puissant uniformément, le test LR a souvent des propriétés statistiques souhaitables."

Je me demande quelles sont les propriétés statistiques ici. Étant donné que l'auteur fait référence à ceux en passant, je suppose qu'ils sont connus des statisticiens.

La seule propriété souhaitable que j'ai réussi à trouver jusqu'à présent est la distribution asymptotique du chi carré de (dans certaines conditions de régularité), où est le rapport LR.2logλλ

Je serais également reconnaissant pour une référence à un texte classique où l'on peut lire sur ces propriétés souhaitées.

Sergey Zykov
la source
Vous pouvez voir (chap. 15 et 16) de van Der Waart: "Statistiques asymptotiques".
kjetil b halvorsen

Réponses:

5

Il pourrait être bon de lire ce qui suit si nous échouons à rejeter l'hypothèse nulle? avant l'explication ci-dessous.

Propriétés souhaitables: puissance

Dans les tests d'hypothèse, l'objectif est de trouver des «preuves statistiques» pour . Ainsi, nous pouvons faire des erreurs de type I, c'est-à-dire que nous rejetons (et décidons qu'il existe des preuves en faveur de ) alors que était vrai (c'est-à-dire que est faux). Une erreur de type I consiste donc à «trouver de fausses preuves» pour .H1H0H1H0H1H1

Une erreur de type II est commise lorsque ne peut pas être rejeté alors qu'il est faux en réalité, c'est-à-dire que nous «acceptons » et nous «manquons» les preuves pour .H0H0H1

La probabilité d'une erreur de type I est notée par , le niveau de signification choisi. La probabilité d'une erreur de type II est notée comme et est appelée la puissance du test, c'est la probabilité de trouver des preuves en faveur de lorsque est vraie.αβ1βH1H1

Dans les tests d'hypothèses statistiques, le scientifique fixe un seuil supérieur pour la probabilité d'une erreur de type I et sous cette contrainte essaie de trouver un test avec une puissance maximale, donnée .α

Les propriétés souhaitables des tests de rapport de vraisemblance sont liées à la puissance

Dans un test d'hypothèse versus l'hypothèse nulle et l'hypothèse alternative sont dites '' simples '', c'est-à-dire que le paramètre est fixé à une valeur, aussi bien sous que sous (plus précisément; les distributions sont entièrement déterminées). H0:θ=θ0H1:θ=θ1H0H1

Le lemme de Neyman-Pearson déclare que, pour les tests d'hypothèse avec des hypothèses simples et pour une probabilité d'erreur de type I donnée, un test de rapport de vraisemblance a la puissance la plus élevée. De toute évidence, une puissance élevée donnée est une propriété souhaitable: la puissance est une mesure de «la facilité avec laquelle il est possible de trouver des preuves pour ».αH1

Lorsque l'hypothèse est composite; comme par exemple contre alors le lemme de Neyman-Pearson ne peut pas être appliqué car il y a 'plusieurs valeurs dans '. Si l'on peut trouver un test tel qu'il soit le plus puissant pour chaque valeur `` sous '', alors ce test est dit `` uniformément le plus puissant '' (UMP) (c'est-à-dire le plus puissant pour chaque valeur sous ).H0:θ=θ1H1:θ>θ1H1H1H1

Il y a un théorème de Karlin et Rubin qui donne les conditions nécessaires pour qu'un test de rapport de vraisemblance soit uniformément le plus puissant. Ces conditions sont remplies pour de nombreux tests unilatéraux (univariés).

La propriété souhaitable du test du rapport de vraisemblance réside donc dans le fait que, dans plusieurs cas, il a la puissance la plus élevée (mais pas dans tous les cas).

Dans la plupart des cas, l'existence d'un test UMP ne peut pas être démontrée et dans de nombreux cas (en particulier les multivariés), il peut être démontré qu'un test UMP n'existe pas . Néanmoins, dans certains de ces cas, des tests de rapport de vraisemblance sont appliqués en raison de leurs propriétés souhaitables (dans le contexte ci-dessus), parce qu'ils sont relativement faciles à appliquer et parfois parce qu'aucun autre test ne peut être défini.

Par exemple, le test unilatéral basé sur la distribution normale standard est UMP.

Intuition derrière le test du rapport de vraisemblance:

Si je veux tester contre alors nous avons besoin d'une observation dérivée d'un échantillon. Notez qu'il s'agit d'une seule valeur. H0:θ=θ0H1:θ=θ1o

Nous savons que est vrai ou est vrai, donc on peut calculer la probabilité de lorsque est vrai (appelons-le ) ainsi que la probabilité d'observer lorsque est vrai (appelons-le ).H0H1oH0L0oH1L1

Si nous avons tendance à croire que «probablement est vrai». Donc, si la ration nous avons des raisons de croire que est plus réaliste que . L1>L0H1L1L0>1H1H0

Si serait quelque chose comme alors nous pourrions conclure que cela pourrait être dû au hasard, donc pour décider que nous avons besoin d'un test et donc de la distribution de qui est .. un rapport de deux probabilités.L1L01.001L1L0

J'ai trouvé ce pdf sur internet.

Communauté
la source
1
Je pense que cela ne répond pas à la question du PO: la citation déclare que même s'il ne peut pas être démontré que le LRT est UMP, il a encore d'autres caractéristiques attrayantes. Alors, quelles sont les fonctionnalités attrayantes qui ne sont pas que c'est UMP?
Cliff AB
@Cliff AB: Je pense que c'est là à la fin de la première section et la deuxième section explique intuitivement pourquoi il est logique d'utiliser LRT. Notez que dans la plupart des cas, il n'y a pas d'UMP et s'il n'y a pas de «meilleur test» ou pas d'alternative, il n'est pas déraisonnable de prendre quelque chose qui «a du sens», je pense? Mais si vous avez des éléments supplémentaires, vous êtes invités à les poster dans votre propre réponse. C'est l'idée derrière SE, je pense.
Peut-être que c'est juste moi qui lis la citation originale légèrement différente: je la lis comme "LRT a d'autres caractéristiques attrayantes, en plus de la puissance".
Cliff AB
1
@CliffAB Je suis d'accord avec votre commentaire, apparemment l'auteur de l'article auquel j'ai fait référence dans ma question signifiait que LRT est bon pour une raison quelconque, même si ce n'est pas un test UMP, et j'espère que cette raison n'est pas seulement la facilité de mise en œuvre ou le manque d'autres alternatives. Je soupçonne (j'espère) que le LRT possède de bonnes propriétés asymptotiques (par exemple, il est cohérent, c'est-à-dire que sa puissance pour tout passe à si nous augmentons le nombre d'observations). H11
Sergey Zykov
ne sous-estimez pas la facilité de mise en œuvre!
Cliff AB du