Je dois expliquer l'intuition derrière ce que fait l'ANOVA à une personne non technique. Y a-t-il un visuel qui explique l'idée? Un visuel qui illustre l'idée clé dans le contexte d'une ANOVA unidirectionnelle avec peut-être 3 niveaux de facteur pourrait être utile?
Supposons que la personne ait suivi des cours de statistique en tant qu'étudiant dans un passé lointain, mais qu'elle ait oublié les détails de l'exécution d'un test z. Cependant, il / elle se souvient que le test d'hypothèse est utilisé pour vérifier si les effets observés sont dus à un hasard ou à un changement réel du paramètre d'intérêt.
Réponses:
L'ANOVA est une technique statistique utilisée pour déterminer si une classification particulière des données est utile pour comprendre la variation d'un résultat. Pensez à diviser les gens en seaux ou en classes selon certains critères, comme la résidence suburbaine et urbaine. La variation totale de la variable dépendante (le résultat qui vous tient à cœur, comme la réactivité à une campagne publicitaire) peut être décomposée en la variation entre les classes et la variation à l' intérieurDes classes. Lorsque la variation intra-classe est faible par rapport à la variation inter-classe, votre schéma de classification est dans un certain sens significatif ou utile pour comprendre le monde. Les membres de chaque cluster se comportent de manière similaire les uns aux autres, mais les personnes de différents clusters se comportent de manière distincte. Cette décomposition est utilisée pour créer un test F formel de cette hypothèse.
la source
J'ai trouvé le livre en ligne de David Lane très utile.
D'une manière plus fondamentale, il y a un article invité dans Annals of Statistics par TP Speed intitulé "Qu'est-ce que l'analyse de la variance?". Cela m'a pris quelques tentatives, mais à la fin, c'était très instructif. L'essence de l'article est de montrer que l'ANOVA est simplement une décomposition de la variance en une somme de variances appartenant à des groupes plus petits. Un autre point important à retenir est que vous pouvez utiliser l'ANOVA pour des variances plus générales (covariances), ce qui m'a semblé intéressant.
la source
Vous pourriez expliquer que l'ANOVA est une décomposition des données sous forme de composants qui correspondent à différents groupes ou variables ou sources de variation . Un exemple est⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜8984818779887787928197928789809479858488⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜8686868686868686868686868686868686868686⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 2- 2- 2- 2- 2- 1- 1- 1- 1- 13333300000⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 1- 3- 2- 1- 1- 3- 5- 3- 5- 0- 2- 6- 1- 2- 5- 2- 4- 0- 4- 6⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟ yt i= μ +βje+τt+ϵt i yt i=y¯+ {y¯je-y¯} + {y¯t-y¯} + {yt i-y¯je-y¯t+y¯} . ⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜626063596367716465666866716768685662606163646359⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜646464646464646464646464646464646464646464646464⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜- 3- 3- 3- 3222222444444- 3- 3- 3- 3- 3- 3- 3- 3⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜- 1- 1- 2- 2- 3- 1- 5- 2- 1- 0- 0- 2- 3- 1- 0- 0- 5- 1- 1- 0- 2- 3- 2- 2⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ et l'algèbre peut être écrite de la même manière.
qui représente les observations d'une conception ANOVA bidirectionnelle (sans réplication), avec des lignes et des colonnes comme les deux groupes. Le modèle algébrique est et la décomposition des données correspondante est calculée comme Pour l'ANOVA unidirectionnelle, un exemple est
Il s'agit principalement d'un commentaire, car il ne s'agit pas d'une explication complète, mais il pourrait être un élément utile de toute explication et pourrait être adapté au niveau nécessaire. Ces tableaux sont beaucoup utilisés dans ce célèbre livre .
la source