Test de Bartlett vs test de Levene

J'essaie actuellement d'adresser les violations aux hypothèses de l'ANOVA. J'ai utilisé Shapiro-Wilk pour tester la normalité et j'ai essayé le test de Levene et le test d'égalité de variance de Bartlett. Depuis lors, j'ai transformé mes données pour essayer de remédier aux inégalités. J'ai relancé le test de Bartlett sur les données transformées en journal, et j'ai toujours reçu une valeur p significative, et par curiosité j'ai également exécuté le test de Levene et obtenu une valeur p non significative. Sur quel test dois-je m'appuyer?

anova data-transformation heteroscedasticity levenes-test Clarice
la source

Réponses:

Probablement non plus. Il serait préférable de regarder vos données et de voir à quel point les violations sont graves. Les modèles linéaires (par exemple, ANOVA) sont assez robustes aux violations mineures lorsque les groupe sont égaux. Une règle d'or pour l'hétéroscédasticité est que la variance de groupe maximale peut être jusqu'à 4 fois la variance de groupe minimale sans trop endommager votre analyse. Si vous craignez qu'il puisse y avoir des violations, une approche encore meilleure consiste à simplement utiliser des analyses robustes aux violations possibles dès le départ, plutôt que d'essayer de détecter les violations et de prendre des décisions en fonction de cela ¹ . $n$

Pour ce que ça vaut, Wikipedia dit que le test de Bartlett est plus sensible aux violations de la normalité que le test de Levene. Vous pouvez donc avoir des données non normales au lieu de données hétéroscédastiques. Encore une fois, une analyse plus robuste peut être préférable ² .

_{1. Voir: Une méthode de principe pour choisir entre le test t ou non paramétrique, par exemple Wilcoxon dans de petits échantillons .

2. Pour différentes manières de traiter l'hétéroscédasticité problématique, voir: Alternatives à l'ANOVA unidirectionnelle pour les données hétéroscédastiques .}

gung - Réintégrer Monica
la source

... assez robuste à des violations mineures avec Ns égaux.

John

Et puis il y a le problème que vous pourriez avoir de bonnes raisons de croire que les échantillons proviennent de populations avec des variances à peu près égales ... C'est sur cela que les tests de robustesse sont basés.

John

Puis-je vérifier visuellement la plage de variances à l'aide de graphiques de diagnostic?

Clarice

Bien sûr, @Clarice. N'importe quel nombre de parcelles aidera à cela. Vous pouvez créer un nuage de points avec les points disposés verticalement dans les niveaux de catégorie marqués sur l'axe des x, puis vous pouvez voir comment ils se comparent. Vous pouvez également essayer des boîtes à moustaches, par exemple.

gung - Réintègre Monica

Pour un test moins sensible pour des conditions non normales que le test de Levene utilise au moins parfois le test de Conover , AKA évalue le test non paramétrique au carré. J'ai trouvé que c'était au moins parfois préféré au test de Bartlett dans l'implémentation Mathematica du VarianceEquivalenceTest .

Voici une liste des méthodes et hypothèses de tests de variance copiées à partir du lien Équivalence de variance ci-dessus

 Bartlett       normality       modified likelihood ratio test
 BrownForsythe  robust          robust Levene test
 Conover        symmetry        Conover's squared ranks test
 FisherRatio    normality       based on variance ratio
 Levene         robust,symmetry compares individual and group variances

Ce qui devrait être évident à partir de cette liste est que les violations d'hypothèses peuvent être testées, bien que la documentation de Mathematica ne précise pas comment, par exemple, le test de symétrie Conover est effectué, ni même pourquoi on teste la symétrie. Et, jusqu'à présent, personne n'a répondu à cette question .

Ainsi, la réponse à la question OP est que seul le test des conditions peut suggérer quelle méthode est préférable dans un cas particulier. De plus, si les 5 tests sont tentés et ne sont pas exclus en raison de la violation des hypothèses, alors on peut généralement distinguer entre les meilleures et les pires réponses avec les réponses générées.

Dans le pire des cas, on peut effectuer une simulation de Monte Carlo en utilisant des valeurs de vérité connues pour explorer quelles conditions conduisent à quelles probabilités. Mais, sans plus d'informations sur le problème lui-même, il est impossible de répondre à la question en termes de données du PO. Si le PO souhaite une réponse spécifique orientée données, veuillez fournir les données.

Carl
la source

Le test de Conover est une suggestion raisonnable ici. Mais vous ne devez pas mélanger une réponse à cette question avec une nouvelle question de votre part et une demande de rétroaction (de qui?) Concernant des parties de votre réponse, ou demander l'approbation de votre modification suggérée.

gung - Rétablir Monica

@gung Ouais bien, l'a changé pour être plus immédiatement utile.

Carl