Je suis nouveau dans les statistiques et je traite actuellement avec ANOVA. J'effectue un test ANOVA en R avec
aov(dependendVar ~ IndependendVar)
Je reçois, entre autres, une valeur F et une valeur p.
Mon hypothèse nulle ( ) est que toutes les moyennes de groupe sont égales.
Il y a beaucoup d'informations disponibles sur la manière dont F est calculé , mais je ne sais pas comment lire une statistique F et comment F et p sont connectés.
Donc, mes questions sont:
- Comment déterminer la valeur F critique pour rejeter ?
- Chaque F a-t-il une valeur p correspondante, de sorte qu'ils signifient fondamentalement la même chose? (par exemple, si , alors H_0 est rejeté)
r
anova
interpretation
JanD
la source
la source
summary(aov(dependendVar ~ IndependendVar)))
ousummary(lm(dependendVar ~ IndependendVar))
? Voulez-vous dire que toutes les moyennes du groupe sont égales les unes aux autres et égales à 0 ou juste les unes aux autres?summary(aov...)
. Merci pour lelm.*
, je ne savais pas à ce sujet :-) Je ne comprends pas ce que vous voulez dire par égal à 0. Si c'est court pour mon 0-Hypothèse, l'hypothèse aurait besoin d'une valeur, et je n'ai pas testé sur une valeur spécifique, alors dans ce cas: juste l'un à l'autre!Réponses:
Pour répondre à vos questions:
Vous trouvez la valeur F critique d'une distribution F (voici un tableau ). Voir un exemple . Vous devez faire attention aux degrés de liberté du numérateur et du dénominateur à sens unique et à double sens.
Oui.
la source
La statistique F est un ratio de 2 mesures de variance différentes pour les données. Si l'hypothèse nulle est vraie, il s'agit d'estimations identiques et le rapport sera d'environ 1.
Le numérateur est calculé en mesurant la variance des moyennes et si les moyennes vraies des groupes sont identiques, cela dépend de la variance globale des données. Mais si l'hypothèse nulle est fausse et que les moyennes ne sont pas toutes égales, alors cette mesure de variance sera plus grande.
Le dénominateur est une moyenne des variances de l'échantillon pour chaque groupe, qui est une estimation de la variance globale de la population (en supposant que tous les groupes ont des variances égales).
Ainsi, lorsque le zéro de tous les moyens égaux est vrai, les 2 mesures (avec quelques termes supplémentaires pour les degrés de liberté) seront similaires et le rapport sera proche de 1. Si le zéro est faux, le numérateur sera grand par rapport à le dénominateur et le ratio seront supérieurs à 1. La recherche de ce ratio sur la table F (ou en le calculant avec une fonction telle que pf dans R) donnera la valeur p.
Si vous préférez utiliser une région de rejet qu'une valeur p, vous pouvez utiliser la table F ou la fonction qf dans R (ou un autre logiciel). La distribution F a 2 types de degrés de liberté. Les degrés de liberté du numérateur sont basés sur le nombre de groupes que vous comparez (pour 1 voie, il s'agit du nombre de groupes moins 1) et les degrés de liberté du dénominateur sont basés sur le nombre d'observations au sein des groupes (pour Il s’agit du nombre d’observations moins le nombre de groupes). Pour les modèles plus compliqués, les degrés de liberté deviennent plus compliqués, mais suivez les mêmes idées.
la source
Vous devriez remarquer quelques autres choses à propos de la distribution sous l'hypothèse nulle:
C'est beaucoup plus que ce que je voulais dire, mais j'espère que cela répond à vos questions!
(Si vous vous demandez d'où proviennent les diagrammes, ils ont été générés automatiquement par l' assistant de statistiques du bureau .)
la source