Tester certains contrastes: est-ce un problème difficile à prouver ou non?

12

J'ai posté ceci sur mathoverflow et personne ne répond:

La méthode de Scheffé pour identifier les contrastes statistiquement significatifs est largement connue. Un contraste entre les moyennes , de populations est une combinaison linéaire dans laquelle , et un multiple scalaire d'un contraste est essentiellement le même contraste, donc on pourrait dire que l'ensemble des contrastes est un espace projectif. La méthode de Scheffé teste une hypothèse nulle qui dit que tous les contrastes parmi ces populations sont , et étant donné un niveau de signification , rejette l'hypothèse nulle avec probabilité i = 1 , , r r r i = 1 c i μ i r i = 1 c i = 0μii=1,,rri=1rciμii=1rci=00 α α 0r0ααétant donné que l'hypothèse nulle est vraie. Et si l'hypothèse nulle est rejetée, Scheffé souligne que son test nous indique quels contrastes diffèrent significativement de (je ne suis pas sûr que l'article Wikipedia que j'ai lié aux points le souligne).0

Je voudrais savoir si l'on peut faire quelque chose de similaire dans une situation différente. Considérons un modèle de régression linéaire simple , où , .ε ii . i . d . N ( 0 , σ 2 ) i = 1 , , nYi=α+βxi+εiεii.i.d.N(0,σ2)i=1,,n

L'hypothèse nulle que je veux considérer concerne un autre type de contraste. Il dit qu'il n'y a pas de sous-ensemble tel que pour i A et E ( Y i ) = α 2 + β x i pour i A , où α 1α 2 . Si le sous-ensemble A est spécifié à l'avance, un t à deux échantillons ordinaireE ( Y i ) = α 1 + β x iA{1,,n}E(Yi)=α1+βxiiAE(Yi)=α2+βxiiAα1α2At-test le fait, mais nous voulons quelque chose qui considère tous les sous-ensembles et maintient la probabilité de rejeter une vraie hypothèse nulle.

On pourrait comprendre cela si l'efficacité n'était pas un problème: trouver un test qui passe par toutes les possibilités. Même alors, c'est problématique; deux contrastes ne seraient pas indépendants. J'ai demandé à un expert sur la détection des valeurs aberrantes à ce sujet et il vient de dire que c'est un cauchemar combinatoire. Ensuite, j'ai demandé si l'on pouvait prouver qu'il n'y avait pas de moyen efficace de le faire, peut-être en y réduisant un problème NP-difficile. Il vient de dire qu'il reste à l'écart des problèmes NP-difficiles.2n11

Donc: peut-on prouver que ce problème est "difficile" ou qu'il ne l'est pas?

Michael Hardy
la source
(+1) Copie d'un commentaire pour clarification à partir de la version MO : Juste un petit point de clarification: comme je l'ai lu, qualifie sous votre hypothèse nulle, mais ( 1 , 2 , 2 ) et ( 1 , 1 , 1 ) ne le font pas (indépendamment de β ). C'est bien ce que vous vouliez? (Il ne semble pas correspondre à certaines des autres allusions faites dans la question.)(α1,α2,α3)=(1,2,3)(1,2,2)(1,1,1)β
cardinal
Comme indiqué ci-dessus, l'hypothèse nulle serait que nous n'avons besoin que d'un , et l'hypothèse alternative est que nous en avons besoin de deux. Je ne sais pas pourquoi tu en as un troisième. On pourrait également considérer l'hypothèse nulle d'un seul α par rapport à l'hypothèse alternative de plusieurs, et c'est peut-être ce que je devrais faire à la place. αα
Michael Hardy
Yi=α+βxi+εiααi
αi

Réponses:

1

Remarqué que personne n'a répondu à cette question jusqu'à présent ...

Z

yi=α+βxi+γzi+ϵi
yi=α+βxi+ϵi.
f(z)t.
Il s'agit d'une variante du problème de partitionnement d'ensemble, qui est connu pour être NP-difficile.
user3697176
la source
Le problème de partitionnement d'ensemble peut-il être réellement réduit à ce problème? Si c'est le cas, cela prouverait que c'est un problème difficile.
Michael Hardy
Ce problème est au moins aussi difficile que le problème classique de partitionnement d'ensemble (SPP). SPP prend une combinaison linéaire de poids et essaie de les multiplier par +/- 1 afin d'obtenir une expression qui résume à 0. Ici, vous voulez satisfaire une inégalité. Si cela était résoluble en temps polynomial pour des entrées arbitraires, alors un argument de bissection montre que vous pouvez également résoudre SPP en temps polynomial. Ce n'est pas exactement une réduction, mais c'est proche.
user3697176