Paramètre de non-centralité - qu'est-ce que c'est, que fait-il, quelle serait une valeur suggérée?

11

J'ai essayé de rafraîchir mes connaissances statistiques, en particulier en ce qui concerne la détermination de la taille de l'échantillon et l'analyse statistique de la puissance. Mais il semble que plus je lis, plus j'ai besoin de lire.

Quoi qu'il en soit, j'ai trouvé un outil appelé G * Power qui semble faire tout ce dont j'ai besoin mais j'ai un problème pour comprendre le paramètre de non-centralité, qu'est-ce que c'est, que fait-il, quelle serait une valeur suggérée, etc.?

Les informations sur wikipedia, etc. sont soit incomplètes, soit je ne fais pas un très bon travail pour les comprendre.

Je mène une série de deux tests z à queue si cela peut vous aider.

ps Quelqu'un peut-il ajouter de meilleures balises à cette question?

Limite
la source

Réponses:

8

Dans les calculs de puissance, nous calibrons les tests en utilisant la connaissance de ce que serait la distribution d'échantillonnage de la statistique de test sous l'hypothèse nulle. Habituellement, il suit une ou normale. Cela vous permet de calculer des "valeurs critiques" pour lesquelles des valeurs dépassant ces valeurs sont jugées trop incohérentes avec ce qui serait attendu si la valeur nulle était vraie.χ2

La puissance d'un test statistique est calculée en spécifiant le modèle de probabilité pour le processus de génération de données sous une autre hypothèse et en calculant la distribution d'échantillonnage pour la même statistique de test. Cela prend maintenant une distribution différente.

Pour les statistiques de test ayant une sous la valeur nulle, elles prennent une distribution non centrale sous l'alternative que vous créez. Ce sont des distributions très compliquées, mais un logiciel standard peut facilement calculer la densité, la distribution et les quantiles. L'astuce est qu'elles sont une convolution de densités standard et de densités de Poisson. En R, la , et les fonctions ont tous option argument qui est, par défaut, 0.χ 2 χ 2χ2χ2χ2dchisqpchisqrchisqncp

Si la statistique de test a une distribution normale standard sous l'hypothèse nulle, elle aura une distribution normale moyenne non nulle sous l'alternative. Ici, cette moyenne est le paramètre de non-centralité. Pour un test t avec une hypothèse de variance égale, la moyenne est donnée par:

δ=μ1μ2σpooled/n

entrez la description de l'image ici

Dans les deux cas, les données générées selon une autre hypothèse auront des statistiques de test suivant une distribution non centrale avec un paramètre de non-centralité ( ). Le est une fonction parfois inconnue, souvent compliquée des autres paramètres de génération de données.δδδ

AdamO
la source
Je comprends pourquoi l'échantillonnage aléatoire conduirait à une moyenne normalement distribuée si l'hypothèse nulle était vraie (votre ligne noire). Mais le Web m'a donné des descriptions contradictoires de la distribution sous l'alternative (c'est-à-dire, quand est supposé être différent de ) - dans la vôtre, c'est également normal (ligne rouge) mais par exemple, real-statistics.com a montré à incliner (voir l'image à mi-chemin de la page). Certes, j'ai raté un tour. Pouvez-vous m'aider à clarifier les choses? μ 1μ2μ1
Ben
@ben Je n'ai pas dessiné de T non central, j'ai dessiné la puissance d'un test statistique (zone rouge, ombrée). La distribution Chi centrale non centrale décrit cette zone lors du calcul de la puissance.
AdamO