Pourquoi tester Levene de l'égalité des variances plutôt que du rapport F?

Réponses:

34

Vous pouvez utiliser un test F pour évaluer la variance de deux groupes, mais l'utilisation de F pour tester les différences de variance nécessite strictement que les distributions soient normales. L'utilisation du test de Levene (c'est-à-dire les valeurs absolues des écarts par rapport à la moyenne) est plus robuste, et l'utilisation du test de Brown-Forsythe (c'est-à-dire les valeurs absolues des écarts par rapport à la médiane ) est encore plus robuste. SPSS utilise ici une bonne approche.

Mise à jour En réponse au commentaire ci-dessous, je veux clarifier ce que j'essaie de dire ici. La question porte sur l'utilisation "d'un simple rapport F du rapport des variances des deux groupes". À partir de cela, j'ai compris que l'alternative était ce qu'on appelle parfois le test de Hartley , qui est une approche très intuitive pour évaluer l'hétérogénéité de la variance. Bien que cela utilise un rapport de variances, il n'est pas le même que celui utilisé dans le test de Levene. Parce que parfois, il est difficile de comprendre ce que l'on entend quand il n'est énoncé que par des mots, je vais donner des équations pour rendre cela plus clair.

F=s22s12
F=MSb/t-levelsMSw/je-levels

Dans les trois cas, nous avons des ratios de variances, mais les variances spécifiques utilisées diffèrent entre eux. Ce qui rend le test de Levene et le test de Brown-Forsythe plus robustes (et également distincts de tout autre ANOVA), c'est qu'ils sont effectués sur des données transformées , tandis que le rapport F des variances de groupe (test de Hartley) utilise les données brutes. Les données transformées en question sont les valeurs absolues des écarts (de la moyenne, dans le cas du test de Levene, et de la médiane, dans le cas du test de Brown-Forsythe).

Il existe d'autres tests d'hétérogénéité de la variance, mais je limite ma discussion à ceux-ci, car je les ai compris être au centre de la question d'origine. La justification du choix parmi eux est basée sur leurs performances si les données d'origine ne sont pas vraiment normales; le test F étant suffisamment non robuste pour ne pas être recommandé; Le test de Levene est légèrement plus puissant que BF si les données sont vraiment normales, mais pas tout à fait aussi robustes si elles ne le sont pas. La citation clé ici est O'Brien (1981), bien que je n'ai pas pu trouver de version disponible sur Internet. Je m'excuse si j'ai mal compris la question ou si je n'étais pas claire.

gung - Réintégrer Monica
la source
2
Parce que la statistique de Levene est un rapport de carrés construits à partir de ces résidus absolus, et se réfère à une distribution F, il n'est pas immédiatement évident qu'elle devrait être plus robuste que d'autres tests basés sur des rapports de carrés! Vous pensez peut-être à des variantes plus robustes, comme le test Brown-Forsythe . Voir une bonne discussion par @chl à stats.stackexchange.com/questions/2591/… .
whuber
@whuber, merci pour le commentaire et le lien. Il y a trop de choses à répondre dans un commentaire, j'ai donc modifié ma réponse. Je crois que ce à quoi je veux en venir devrait être plus clair maintenant. Cependant, si j'ai mal compris ou si je me trompe, je peux supprimer cette réponse.
gung - Rétablir Monica
Le (nouveau) dernier paragraphe rend bien votre point (+1).
whuber