Comment puis-je tester si la moyenne (par exemple, la pression artérielle) d'un sous-groupe (par exemple, ceux qui sont décédés) diffère de l'ensemble du groupe (par exemple, toutes les personnes atteintes de la maladie, y compris celles qui sont décédées)?
De toute évidence, le premier est un sous-groupe du second.
Quel test d'hypothèse dois-je utiliser?
hypothesis-testing
group-differences
user1061210
la source
la source
Réponses:
Comme le note Michael, lorsqu'ils comparent un sous-groupe à un groupe global, les chercheurs comparent généralement le sous-groupe au sous-ensemble du groupe global qui n'inclut pas le sous-groupe.
Pensez-y de cette façon.
Si est la proportion de personnes décédées et est la proportion de personnes décédées , et1 - pp 1 - p
oùest la moyenne globale, est la moyenne de ceux qui sont morts et est la moyenne de ceux qui sont encore en vie. alorsˉ X d ˉ X aX¯. X¯ré X¯une
Supposons . D'où . ¯ X . ≠p ¯ X d +(1-p) ¯ X d = ¯ X dXré¯≠ Xune¯ X.¯≠ p Xré¯+ ( 1 - p ) Xré¯= Xré¯
Supposons . D'où , puis et depuis , alors .X.¯≠ Xré¯ Xré¯≠ p Xré¯+ ( 1 - p ) Xune¯ ( 1 - p ) Xré¯≠ ( 1 - p ) Xune¯ ( 1 - p ) ≠ 0 Xré¯≠ Xune¯
La même chose peut faire pour les inégalités.
Ainsi, les chercheurs testent généralement la différence entre le sous-groupe et le sous-ensemble du groupe global qui n'inclut pas le sous-groupe. Cela a pour effet de montrer que le sous-groupe diffère du groupe global. Il vous permet également d'utiliser des méthodes conventionnelles comme un test t de groupes indépendants.
la source
La façon de tester ici est de comparer ceux qui ont eu la maladie et qui sont morts à ceux qui ont eu la maladie et qui ne sont pas morts. Vous pouvez appliquer le test t à deux échantillons ou le test de somme de rang de Wilcoxon si la normalité ne peut pas être supposée.
la source
Ce que vous devez faire est de tester les proportions de la population (grand échantillon). Les statistiques concernant la proportion de la population ont souvent un échantillon de grande taille (n => 30), par conséquent, la distribution d'approximation normale et les statistiques associées sont utilisées pour déterminer si la proportion de l'échantillon (tension artérielle des personnes décédées) = la proportion de la population (tout le monde) qui ont eu la maladie, y compris ceux qui sont morts).
Autrement dit, lorsque la taille de l'échantillon est supérieure ou égale à 30, nous pouvons utiliser les statistiques du score z pour comparer la proportion de l'échantillon à la proportion de la population en utilisant la valeur de l'écart-type de l'échantillon p-hat, pour estimer l'écart-type de l'échantillon, p s'il n'est pas connu.
La distribution de l'échantillon de P (proportion) est approximativement normale avec une valeur moyenne ou attendue, E (P) = p-chapeau et erreur standard, sigma (r) = sqrt (p * q / n).
Voici les questions probables de l'hypothèse de test que l'on peut poser en comparant deux proportions:
H0: p-chapeau = p vs H1: p-chapeau différent de p
H0: chapeau p = p vs H1: chapeau p> p
H0: chapeau p = p vs H1: chapeau p <p
Les statistiques utilisées pour tester la grande taille de l'échantillon sont:
Les statistiques de test sont liées à la distribution normale standard:
Les statistiques z-score pour les proportions
p-chapeau-p / sqrt (pq / n)
, où p = estimation de la proportion, q = 1-p et est la proportion de la population.
La moyenne de la proportion est:
np / n = chapeau-p = x / n
Écart-type:
= sqrt (npq / n) = sqrt (pq / n)
Règles de décision:
Test de queue supérieure (): (H0: chapeau P> = P)
Acceptez H0 si Z <= Z (1-alpha)
Rejeter H0 si Z> Z (1-alpha)
Test de queue inférieure (Ha: chapeau P <= P):
Acceptez H0 si Z> = Z (1-alpha)
Rejeter H0 si Z
Test bilatéral (Ha: chapeau P différent de P):
Acceptez H0 si Z (alpha / 2) <= Z <= Z (1-alpha / 2)
Rejeter H0 si Z <Z (alpha / 2) ou si Z> Z (1-alpha / 2)
la source