Comment expliquer l'intuition derrière l'ANOVA?

9

Je dois expliquer l'intuition derrière ce que fait l'ANOVA à une personne non technique. Y a-t-il un visuel qui explique l'idée? Un visuel qui illustre l'idée clé dans le contexte d'une ANOVA unidirectionnelle avec peut-être 3 niveaux de facteur pourrait être utile?

Supposons que la personne ait suivi des cours de statistique en tant qu'étudiant dans un passé lointain, mais qu'elle ait oublié les détails de l'exécution d'un test z. Cependant, il / elle se souvient que le test d'hypothèse est utilisé pour vérifier si les effets observés sont dus à un hasard ou à un changement réel du paramètre d'intérêt.

stats_student
la source
1
Veuillez ajouter à votre question ce que vous attendez de l'auditeur pour ses connaissances statistiques. Connaissent-ils un test t? Ont-ils une certaine familiarité avec les tests d'hypothèses? ... etc. S'ils n'en ont absolument aucun, il n'y a pas beaucoup de détails dans lesquels je voudrais entrer.
John
3
D'intérêt possible: comment visualiser ce que fait l'ANOVA?
chl
1
Que diriez-vous d'utiliser un exemple de trois feux d'artifice explosant dans le ciel? Les trois hauteurs d'explosion seraient leur moyen de groupe. Etant donné les trois mêmes hauteurs, la différence peut sembler plus grande si le rayon d'explosion du feu d'artifice est petit (faible variation au sein du groupe); et ils peuvent également se sentir indifférents si le rayon d'explosion est énorme par rapport à leurs différences de hauteur d'explosion. Par conséquent, les hauteurs d'explosion (entre) et le rayon d'explosion (à l'intérieur) doivent être pris en compte.
Penguin_Knight
J'ai trouvé le livre en ligne de David Lane très utile. onlinestatbook.com/2/analysis_of_variance/intro.html
idnavid
J'ai écrit une explication complètement non mathématique de la raison pour laquelle nous utilisons les variances pour comparer les moyennes. Voici un lien vers l'article de blog.
Peter Flom

Réponses:

10

L'ANOVA est une technique statistique utilisée pour déterminer si une classification particulière des données est utile pour comprendre la variation d'un résultat. Pensez à diviser les gens en seaux ou en classes selon certains critères, comme la résidence suburbaine et urbaine. La variation totale de la variable dépendante (le résultat qui vous tient à cœur, comme la réactivité à une campagne publicitaire) peut être décomposée en la variation entre les classes et la variation à l' intérieurDes classes. Lorsque la variation intra-classe est faible par rapport à la variation inter-classe, votre schéma de classification est dans un certain sens significatif ou utile pour comprendre le monde. Les membres de chaque cluster se comportent de manière similaire les uns aux autres, mais les personnes de différents clusters se comportent de manière distincte. Cette décomposition est utilisée pour créer un test F formel de cette hypothèse.

Dimitriy V. Masterov
la source
1

J'ai trouvé le livre en ligne de David Lane très utile.

D'une manière plus fondamentale, il y a un article invité dans Annals of Statistics par TP Speed ​​intitulé "Qu'est-ce que l'analyse de la variance?". Cela m'a pris quelques tentatives, mais à la fin, c'était très instructif. L'essence de l'article est de montrer que l'ANOVA est simplement une décomposition de la variance en une somme de variances appartenant à des groupes plus petits. Un autre point important à retenir est que vous pouvez utiliser l'ANOVA pour des variances plus générales (covariances), ce qui m'a semblé intéressant.

idnavid
la source
-1

Vous pourriez expliquer que l'ANOVA est une décomposition des données sous forme de composants qui correspondent à différents groupes ou variables ou sources de variation . Un exemple est

(8988979484779279818787858792898479818088)=(8686868686868686868686868686868686868686)+(-6-6-6-6-3-3-3-3-1-1-1-1-2-2-2-2-4-4-4-4)+(-2-130-2-130-2-130-2-130-2-130)+(-1-3-2-2-3-5-6-4-2-3-1-0-1-5-2-4-1-0-5-6)

qui représente les observations d'une conception ANOVA bidirectionnelle (sans réplication), avec des lignes et des colonnes comme les deux groupes. Le modèle algébrique est et la décomposition des données correspondante est calculée comme Pour l'ANOVA unidirectionnelle, un exemple est
ytje=μ+βje+τt+ϵtje
ytje=y¯+{y¯je-y¯}+{y¯t-y¯}+{ytje-y¯je-y¯t+y¯}.
(626368566067666263717160596467616568636668646359)=(646464646464646464646464646464646464646464646464)+(-324-3-324-3-324-3-324-324-324-3-3-3)+(-1-3-0-5-1-1-2-1-2-5-3-1-2-2-1-0-1-0-2-0-0-3-2-2)
et l'algèbre peut être écrite de la même manière.

Il s'agit principalement d'un commentaire, car il ne s'agit pas d'une explication complète, mais il pourrait être un élément utile de toute explication et pourrait être adapté au niveau nécessaire. Ces tableaux sont beaucoup utilisés dans ce célèbre livre .

kjetil b halvorsen
la source
Pourquoi le downvote?
kjetil b halvorsen