Contexte
En informatique, en mathématiques et parfois dans d'autres domaines, les exemples «ésotériques» peuvent non seulement être divertissants, mais utiles pour illustrer certains concepts, par exemple:
Bogosort et Slowsort sont des algorithmes de tri très inefficaces qui peuvent être utilisés pour comprendre les propriétés des algorithmes, en particulier par rapport à d'autres algorithmes de tri.
Les langages de programmation ésotériques démontrent à quel point le concept d'un langage de programmation est étendu et aident à apprécier de bons langages de programmation.
La fonction Weierstraß et la fonction Dirichlet sont principalement utilisées pour illustrer certaines idées fausses sur le concept de continuité.
Je prépare actuellement un enseignement sur l'utilisation des tests d'hypothèses et je pense qu'avoir un test à très faible puissance (mais sans autres défauts) aiderait à illustrer le concept de puissance statistique. (Bien sûr, je dois encore décider moi-même si un exemple donné est didactiquement utile pour mon public ou tout simplement déroutant.)
Question réelle
Existe-t-il un test statistique à faible puissance intentionnelle, plus précisément:
- Le test s'inscrit dans le cadre général des tests d'hypothèse, c'est-à-dire qu'il fonctionne avec une hypothèse nulle, a des exigences et renvoie une valeur p (correcte) .
- Il n'est pas destiné / proposé pour une application sérieuse.
- Il a une très faible puissance (en raison d'un défaut de conception intentionnel et non en raison de la faible taille de l'échantillon ou de l'effet).
Si vous pouvez fondamentalement affirmer qu'un tel test ne peut pas exister, je considérerais également cela comme une réponse valable à ma question. Si, par contre, il existe une pléthore de tels tests, je suis intéressé par le plus efficace sur le plan didactique, c'est-à-dire qu'il devrait être facilement accessible et avoir un effet saisissant.
Notez que je ne demande pas une sélection générale d'erreurs statistiques (cueillette de cerises, etc.) ou similaire.
Ce que j'ai trouvé jusqu'à présent
Les recherches sur Internet ne m'ont rien rapporté.
Chaque tentative de construire quelque chose comme ça aboutissait à un test existant (utile) ou le format n'était pas celui d'un test normal. Par exemple, j'ai pensé à un test pour déterminer si une population a une médiane positive qui ne renvoie que oui si tous les échantillons sont positifs; mais ce test ne renvoie pas de valeur p et ne rentre donc pas dans le cadre de test habituel. Si je compte simplement les signes positifs et négatifs comme une statistique de test (et calcule les valeurs de p en conséquence), je me retrouve avec le test de signe , qui est un test raisonnable.
la source
Réponses:
Il y a un corollaire peu remarqué au lemme de Neyman – Pearson (preuve dans Geisser (2006), Modes of Parametric Statistical Inference , Ch 4.4): définit le test de niveau le moins puissant , , de l'hypothèse nulle densité vs densité partir des données .Eϕ(X)=α
ϕ(x)={0 1 when f0(x)<kf1(x)when f0(x)>kf1(x) αα ϕ H0: f0 H1: f1 x
De ce résultat, vous pouvez dériver des tests uniformément les moins puissants, localement les moins puissants, uniformément les moins puissants similaires et les moins puissants "totalement biaisés" (je veux dire ceux qui ont une puissance plus faible sous n'importe quelle alternative que sous le nul). Si vous avez déjà un uniforme le plus puissant, etc. test, multipliez simplement votre statistique de test par -1 pour maintenir le partitionnement de l'espace échantillon qu'il induit tout en inversant l'ordre des partitions.
Peut-être, comme le suggère @ user54038, "l'échec d'une méthode générale de construction de tests" pourrait être plus intéressant. Lehmann (1950), "Quelques principes de la théorie des tests d'hypothèses statistiques", Ann. Math. Statist. , 21 , 1, attribue l'exemple suivant à Stein:
Notez que c'est le test de vraisemblance généralisé qu'il envisage, avec dans le rôle d'un paramètre de nuisance à maximiser. Ainsi, lorsque ou , ou respectivement, et le rapport de vraisemblance arrive à dans les deux cas; pour toute autre valeur de c'est la valeur inférieure de .p X=−2 X=2 p^=1 p^=0 2Cα X 1−C1−α
la source
(Lié au commentaire de @Scortchi)
Supposons et nous voulons tester l'hypothèseX∼N(μ,1)
Par souci d'esetoricism, augmentons nos données avec un "coin flip" indépendant où est connu et pas plus petit que le niveau de signification (c'est-à-dire ). Considérez les régions de rejet du formulaire:Z∼Bernoulli(p) p α p∈[α,1]
Par construction, il s'agit d'un test valide de taille .α
Cependant, la puissance de ce test ne peut jamais être supérieure à . Par exemple, supposons que nos données observées soient . Il est évident que l'hypothèse nulle devrait être rejetée, mais puisque notre pièce "montre des queues", nous ne rejetons pas le nul. La définition de conduit à un exemple encore plus stupide où la région de rejet ne dépend pas du tout de , mais est toujours une région de rejet valide avec la taille .p (x,z)=(1000000,0) p = α X αp=α X α
Une question similaire pourrait être posée comme devoirs en changeant l'intersection en union dans la région de rejet. Cette région est uniformément moins puissante que celle sans , mais est plus raisonnable dans le sens où la puissance n'a pas de limite supérieure.Z
la source