Comment tester si la moyenne du sous-groupe diffère du groupe global qui comprend le sous-groupe?

9

Comment puis-je tester si la moyenne (par exemple, la pression artérielle) d'un sous-groupe (par exemple, ceux qui sont décédés) diffère de l'ensemble du groupe (par exemple, toutes les personnes atteintes de la maladie, y compris celles qui sont décédées)?

De toute évidence, le premier est un sous-groupe du second.

Quel test d'hypothèse dois-je utiliser?

user1061210
la source
Testez-vous une différence de moyens?
Macro

Réponses:

9

Comme le note Michael, lorsqu'ils comparent un sous-groupe à un groupe global, les chercheurs comparent généralement le sous-groupe au sous-ensemble du groupe global qui n'inclut pas le sous-groupe.

Pensez-y de cette façon.

Si est la proportion de personnes décédées et est la proportion de personnes décédées , et1 - pp1-p

X¯.=pX¯+(1-p)X¯une

oùest la moyenne globale, est la moyenne de ceux qui sont morts et est la moyenne de ceux qui sont encore en vie. alorsˉ X d ˉ X aX¯.X¯X¯une

X¯X¯une
si et seulement si quand

X¯X¯.

Supposons . D'où . ¯ X . p ¯ X d +(1-p) ¯ X d = ¯ X dX¯Xune¯X.¯pX¯+(1-p)X¯=X¯

Supposons . D'où , puis et depuis , alors .X.¯X¯X¯pX¯+(1-p)Xune¯(1-p)X¯(1-p)Xune¯(1-p)0X¯Xune¯

La même chose peut faire pour les inégalités.

Ainsi, les chercheurs testent généralement la différence entre le sous-groupe et le sous-ensemble du groupe global qui n'inclut pas le sous-groupe. Cela a pour effet de montrer que le sous-groupe diffère du groupe global. Il vous permet également d'utiliser des méthodes conventionnelles comme un test t de groupes indépendants.

Jeromy Anglim
la source
1
Re: "Vous devez comparer le sous-groupe au sous-ensemble du groupe global qui n'inclut pas le sous-groupe" - oui, c'est une façon de le faire mais cela pose une question légèrement différente - il teste les morts par rapport aux non-morts quand il semble à OP veut tester la différence de moyens entre les morts et les personnes dont le statut de mortalité est inconnu, donc je ne suis pas sûr que devrait être le bon mot. Vous pouvez tester la différence de moyenne entre le sous-ensemble et le groupe global tant que vous tenez compte de la covariance entre et Dans votre calcul d'erreur standard. X¯X¯.
Macro
@Macro bon point. Merci. J'ai un peu changé le libellé en "chercheurs généralement ..."
Jeromy Anglim
@Marco. Merci pour le commentaire. Mais comment est calculée la covariance de et des groupes non appariés (sous-groupe et groupe)? X¯X¯
giordano
@JeromyAnglim je ne pense pas que vous ayez besoin du "typiquement". Si nous écrivons ce que vous avez écrit en notation de population (mu au lieu de barres x par exemple) et examinons les hypothèses nulles et alternatives, par le même argument que vous avez fait, tester que mu est différent de mu_d est identique à tester mu_a est différent de mu_d. Ainsi, le test t à deux échantillons est toujours correct. Donc, au lieu de typiquement, je dirais "c'est équivalent à effectuer ce test avec un test t à deux échantillons"
Richard DiSalvo
2

La façon de tester ici est de comparer ceux qui ont eu la maladie et qui sont morts à ceux qui ont eu la maladie et qui ne sont pas morts. Vous pouvez appliquer le test t à deux échantillons ou le test de somme de rang de Wilcoxon si la normalité ne peut pas être supposée.

Michael R. Chernick
la source
Peux-tu être plus précis? quel genre de test t à deux échantillons? test t non apparié? Je pensais que pour le test t, vous supposez l'INDÉPENDANCE et la NORMALITÉ.
user1061210
1
Lorsque les groupes sont séparés comme nous l'avons suggéré, les échantillons sont indépendants. Le test t ne serait pas apparié car les sous-groupes n'ont pas besoin d'être égaux et il n'y a pas de moyen naturel d'appairer les échantillons même si les tailles d'échantillon étaient égales. J'ai mentionné le test de Wilcoxon parce que l'hypothèse de normalité n'est peut-être pas valide et le test de Wilcoxon ne nécessite pas de normalité.
Michael R. Chernick
0

Ce que vous devez faire est de tester les proportions de la population (grand échantillon). Les statistiques concernant la proportion de la population ont souvent un échantillon de grande taille (n => 30), par conséquent, la distribution d'approximation normale et les statistiques associées sont utilisées pour déterminer si la proportion de l'échantillon (tension artérielle des personnes décédées) = la proportion de la population (tout le monde) qui ont eu la maladie, y compris ceux qui sont morts).

Autrement dit, lorsque la taille de l'échantillon est supérieure ou égale à 30, nous pouvons utiliser les statistiques du score z pour comparer la proportion de l'échantillon à la proportion de la population en utilisant la valeur de l'écart-type de l'échantillon p-hat, pour estimer l'écart-type de l'échantillon, p s'il n'est pas connu.

La distribution de l'échantillon de P (proportion) est approximativement normale avec une valeur moyenne ou attendue, E (P) = p-chapeau et erreur standard, sigma (r) = sqrt (p * q / n).

Voici les questions probables de l'hypothèse de test que l'on peut poser en comparant deux proportions:

  1. (Test bilatéral)

H0: p-chapeau = p vs H1: p-chapeau différent de p

  1. (Test à droite)

H0: chapeau p = p vs H1: chapeau p> p

  1. (Test de gauche)

H0: chapeau p = p vs H1: chapeau p <p

Les statistiques utilisées pour tester la grande taille de l'échantillon sont:

Les statistiques de test sont liées à la distribution normale standard:

Les statistiques z-score pour les proportions

p-chapeau-p / sqrt (pq / n)

, où p = estimation de la proportion, q = 1-p et est la proportion de la population.

La moyenne de la proportion est:

np / n = chapeau-p = x / n

Écart-type:

= sqrt (npq / n) = sqrt (pq / n)

Règles de décision:

Test de queue supérieure (): (H0: chapeau P> = P)

Acceptez H0 si Z <= Z (1-alpha)

Rejeter H0 si Z> Z (1-alpha)

Test de queue inférieure (Ha: chapeau P <= P):

Acceptez H0 si Z> = Z (1-alpha)

Rejeter H0 si Z

Test bilatéral (Ha: chapeau P différent de P):

Acceptez H0 si Z (alpha / 2) <= Z <= Z (1-alpha / 2)

Rejeter H0 si Z <Z (alpha / 2) ou si Z> Z (1-alpha / 2)

Chiemeka Ezeogu
la source