J'essaie actuellement d'adresser les violations aux hypothèses de l'ANOVA. J'ai utilisé Shapiro-Wilk pour tester la normalité et j'ai essayé le test de Levene et le test d'égalité de variance de Bartlett. Depuis lors, j'ai transformé mes données pour essayer de remédier aux inégalités. J'ai relancé le test de Bartlett sur les données transformées en journal, et j'ai toujours reçu une valeur p significative, et par curiosité j'ai également exécuté le test de Levene et obtenu une valeur p non significative. Sur quel test dois-je m'appuyer?
Probablement non plus. Il serait préférable de regarder vos données et de voir à quel point les violations sont graves. Les modèles linéaires (par exemple, ANOVA) sont assez robustes aux violations mineures lorsque les groupe sont égaux. Une règle d'or pour l'hétéroscédasticité est que la variance de groupe maximale peut être jusqu'à 4 fois la variance de groupe minimale sans trop endommager votre analyse. Si vous craignez qu'il puisse y avoir des violations, une approche encore meilleure consiste à simplement utiliser des analyses robustes aux violations possibles dès le départ, plutôt que d'essayer de détecter les violations et de prendre des décisions en fonction de cela 1 . n
Pour ce que ça vaut, Wikipedia dit que le test de Bartlett est plus sensible aux violations de la normalité que le test de Levene. Vous pouvez donc avoir des données non normales au lieu de données hétéroscédastiques. Encore une fois, une analyse plus robuste peut être préférable 2 .
... assez robuste à des violations mineures avec Ns égaux.
John
Et puis il y a le problème que vous pourriez avoir de bonnes raisons de croire que les échantillons proviennent de populations avec des variances à peu près égales ... C'est sur cela que les tests de robustesse sont basés.
John
Puis-je vérifier visuellement la plage de variances à l'aide de graphiques de diagnostic?
Clarice
Bien sûr, @Clarice. N'importe quel nombre de parcelles aidera à cela. Vous pouvez créer un nuage de points avec les points disposés verticalement dans les niveaux de catégorie marqués sur l'axe des x, puis vous pouvez voir comment ils se comparent. Vous pouvez également essayer des boîtes à moustaches, par exemple.
gung - Réintègre Monica
4
Pour un test moins sensible pour des conditions non normales que le test de Levene utilise au moins parfois le test de Conover , AKA évalue le test non paramétrique au carré. J'ai trouvé que c'était au moins parfois préféré au test de Bartlett dans l'implémentation Mathematica du VarianceEquivalenceTest .
Voici une liste des méthodes et hypothèses de tests de variance copiées à partir du lien Équivalence de variance ci-dessus
Bartlett normality modified likelihood ratio test
BrownForsythe robust robust Levene test
Conover symmetry Conover's squared ranks test
FisherRatio normality based on variance ratio
Levene robust,symmetry compares individual and group variances
Ce qui devrait être évident à partir de cette liste est que les violations d'hypothèses peuvent être testées, bien que la documentation de Mathematica ne précise pas comment, par exemple, le test de symétrie Conover est effectué, ni même pourquoi on teste la symétrie. Et, jusqu'à présent, personne n'a répondu à cette question .
Ainsi, la réponse à la question OP est que seul le test des conditions peut suggérer quelle méthode est préférable dans un cas particulier. De plus, si les 5 tests sont tentés et ne sont pas exclus en raison de la violation des hypothèses, alors on peut généralement distinguer entre les meilleures et les pires réponses avec les réponses générées.
Dans le pire des cas, on peut effectuer une simulation de Monte Carlo en utilisant des valeurs de vérité connues pour explorer quelles conditions conduisent à quelles probabilités. Mais, sans plus d'informations sur le problème lui-même, il est impossible de répondre à la question en termes de données du PO. Si le PO souhaite une réponse spécifique orientée données, veuillez fournir les données.
Le test de Conover est une suggestion raisonnable ici. Mais vous ne devez pas mélanger une réponse à cette question avec une nouvelle question de votre part et une demande de rétroaction (de qui?) Concernant des parties de votre réponse, ou demander l'approbation de votre modification suggérée.
gung - Rétablir Monica
@gung Ouais bien, l'a changé pour être plus immédiatement utile.
Pour un test moins sensible pour des conditions non normales que le test de Levene utilise au moins parfois le test de Conover , AKA évalue le test non paramétrique au carré. J'ai trouvé que c'était au moins parfois préféré au test de Bartlett dans l'implémentation Mathematica du VarianceEquivalenceTest .
Voici une liste des méthodes et hypothèses de tests de variance copiées à partir du lien Équivalence de variance ci-dessus
Ce qui devrait être évident à partir de cette liste est que les violations d'hypothèses peuvent être testées, bien que la documentation de Mathematica ne précise pas comment, par exemple, le test de symétrie Conover est effectué, ni même pourquoi on teste la symétrie. Et, jusqu'à présent, personne n'a répondu à cette question .
Ainsi, la réponse à la question OP est que seul le test des conditions peut suggérer quelle méthode est préférable dans un cas particulier. De plus, si les 5 tests sont tentés et ne sont pas exclus en raison de la violation des hypothèses, alors on peut généralement distinguer entre les meilleures et les pires réponses avec les réponses générées.
Dans le pire des cas, on peut effectuer une simulation de Monte Carlo en utilisant des valeurs de vérité connues pour explorer quelles conditions conduisent à quelles probabilités. Mais, sans plus d'informations sur le problème lui-même, il est impossible de répondre à la question en termes de données du PO. Si le PO souhaite une réponse spécifique orientée données, veuillez fournir les données.
la source