Je suis doctorant en psychologie expérimentale et je m'efforce d'améliorer mes compétences et mes connaissances sur la façon d'analyser mes données.
Jusqu'à ma 5e année en psychologie, je pensais que les modèles de régression (par exemple, ANOVA) supposaient les choses suivantes:
- normalité des données
- homogénéité de la variance des données, etc.
Mes cours de premier cycle m'amènent à croire que les hypothèses concernaient les données. Cependant dans ma 5e année, certains de mes instructeurs ont souligné le fait que les hypothèses concernent l'erreur (estimée par les résidus) et non les données brutes.
Récemment, je parlais de la question des hypothèses avec certains de mes collègues qui ont également reconnu qu'ils n'avaient découvert l'importance de vérifier les hypothèses sur le résidu qu'au cours de leurs dernières années universitaires.
Si je comprends bien, les modèles de régression font des hypothèses sur l'erreur. Il est donc logique de vérifier les hypothèses sur les résidus. Si oui, pourquoi certaines personnes vérifient les hypothèses sur les données brutes? Est-ce parce qu'une telle procédure de vérification se rapproche de ce que nous obtiendrions en vérifiant le résidu?
Je serais très intéressé par une discussion sur cette question avec certaines personnes qui ont des connaissances plus précises que mes collègues et moi. Je vous remercie d'avance pour vos réponses.
la source
Je trouve la différenciation entre les résidus et les données brutes inutile car les deux se réfèrent davantage à votre échantillon réel et non à la distribution sous-jacente de la population. Il vaut mieux considérer que certaines exigences sont des «exigences en groupe» et d'autres «entre les hypothèses de groupe».
Par exemple, l'homénité de la variance est une "hypothèse inter-groupe" car elle dit que la variance intra-groupe est la même pour tous les groupes.
La normalité est une hypothèse "au sein du groupe" qui exige que dans chaque groupe y soit distribué normalement.
Notez qu'avoir une normalité sur l'ensemble de votre y brut signifie généralement que vous n'avez aucun effet - regardez la distribution du sexe sans faire de différence entre les femmes et les hommes. Il ne sera pas distribué normalement, en raison du fort effet de genre. Mais au sein de chaque sexe, cela tient assez bien.
la source