Je suis sûr que je suis complètement enroulé autour de ma tête, mais je n'arrive pas à comprendre.
Le test t compare deux distributions normales utilisant la distribution Z. C'est pourquoi il y a une hypothèse de normalité dans les DONNÉES.
L'ANOVA équivaut à une régression linéaire avec des variables nominales et utilise la somme de carrés, comme pour MLS. C'est pourquoi on suppose une normalité de RESIDUALS.
Cela m'a pris plusieurs années, mais je pense avoir enfin compris ces faits fondamentaux. Alors, pourquoi le test t est-il équivalent à une ANOVA à deux groupes? Comment peuvent-ils être équivalents s'ils ne supposent même pas les mêmes choses à propos des données?
distributions
regression
normality-assumption
t-test
anova
Chris Beeley
la source
la source
Réponses:
Le test t avec deux groupes suppose que chaque groupe est normalement distribué avec la même variance (bien que les moyennes puissent différer selon l'hypothèse alternative). Cela équivaut à une régression avec une variable muette, car elle permet à la moyenne de chaque groupe de différer, mais pas à la variance. Par conséquent, les résidus (égaux aux données avec les groupes moyens soustraits) ont la même distribution - c'est-à-dire qu'ils sont normalement distribués avec une moyenne nulle.
Un test t avec des variances inégales n'équivaut pas à une ANOVA à un facteur.
la source
Le test t est simplement un cas spécial du test F, dans lequel seuls deux groupes sont comparés. Le résultat de l'un ou de l'autre sera exactement le même en termes de p-valeur et il existe également une relation simple entre les statistiques F et t. F = t ^ 2. Les deux tests sont algébriquement équivalents et leurs hypothèses sont les mêmes.
En fait, ces équivalences s’appliquent à toute la classe des ANOVA, tests t et modèles de régression linéaire. Le test t est un cas particulier d’ANOVA. L'ANOVA est un cas particulier de régression. Toutes ces procédures sont incluses dans le modèle linéaire général et partagent les mêmes hypothèses.
Vous pouvez penser à cela comme une normalité dans les données, mais vous vérifiez la normalité dans chaque groupe - ce qui revient en fait à vérifier la normalité dans les résidus lorsque le seul prédicteur du modèle est un indicateur de groupe. De même avec des variances égales.
En passant, R n'a pas de routine distincte pour l'ANOVA. Les fonctions anova de R ne sont que des enveloppes de la fonction lm () - la même chose utilisée pour les modèles de régression linéaire - présentées de manière légèrement différente pour fournir ce que l’on trouve généralement dans un résumé ANOVA plutôt qu’un résumé de régression.
la source
lm()
, sauf si vous passez à des modèles mixtes avec le packagenlme
orlme4
, mais il existe un moyen pratique de gérer des mesures répétées en spécifiant leError
terme dansaov()
, voir plus de détails dans le tutoriel Baron & Li, §6.9, j.mp/ c5ME4uaov()
est construit sur lalm()
fonction mais inclut un argument supplémentaire, appelé Termes spéciaux , commeError
.Je suis tout à fait d'accord avec la réponse de Rob, mais permettez-moi de l'exprimer autrement (avec wikipedia):
Hypothèses ANOVA :
Hypothèses t-test :
Par conséquent, je réfuterais la question, car ils ont évidemment les mêmes hypothèses (bien que dans un ordre différent :-)).
la source
Un point évident que tout le monde a négligé: avec ANOVA, vous testez à zéro que la moyenne est identique quelles que soient les valeurs de vos variables explicatives. Avec un test T, vous pouvez également tester le cas unilatéral, à savoir que la moyenne est spécifiquement supérieure à une valeur de votre variable explicative à l'autre.
la source
Je préférerai utiliser le test t pour comparer deux groupes et utiliserai l'ANOVA pour plus de 2 groupes, pour des raisons particulières. La raison importante étant l'hypothèse d'égale variance.
la source