Je travaille avec une analyse spatiale exploratoire dans R en utilisant le package spdep.
Je suis tombé sur une option pour ajuster les valeurs de p des indicateurs locaux d'association spatiale (LISA) calculés à l'aide de la localmoran
fonction. Selon les documents, il vise à:
... ajustement de la valeur de probabilité pour plusieurs tests.
Plus loin dans la documentation de p.adjustSP
J'ai lu que les options disponibles sont:
Les méthodes d'ajustement comprennent la correction de Bonferroni ("" bonferroni "") dans laquelle les valeurs de p sont multipliées par le nombre de comparaisons. Holm (1979) ('"holm"'), Hochberg (1988) ('"hochberg"'), Hommel (1988) ('"hommel"') et Benjamini & Hochberg (1995) incluent également quatre corrections moins conservatrices. ('"fdr"'), respectivement. Une option d'intercommunication ("" aucun "") est également incluse.
Les quatre premières méthodes sont conçues pour donner un contrôle fort du taux d'erreur familial. Il ne semble pas y avoir de raison d'utiliser la correction de Bonferroni non modifiée car elle est dominée par la méthode de Holm, qui est également valable sous des hypothèses arbitraires.
Les méthodes de Hochberg et de Hommel sont valables lorsque les tests d'hypothèse sont indépendants ou lorsqu'ils sont associés de manière non négative (Sarkar, 1998; Sarkar et Chang, 1997). La méthode de Hommel est plus puissante que celle de Hochberg, mais la différence est généralement faible et les valeurs de p de Hochberg sont plus rapides à calculer.
Les méthodes "BH" (alias "fdr") et "BY" de Benjamini, Hochberg et Yekutieli contrôlent le taux de fausses découvertes, la proportion attendue de fausses découvertes parmi les hypothèses rejetées. Le taux de fausses découvertes est une condition moins stricte que le taux d'erreur familial, ces méthodes sont donc plus puissantes que les autres.
Quelques questions qui sont apparues:
- En clair - quel est le but de cet ajustement?
- Est-il nécessaire d'utiliser de telles corrections?
- Si oui - comment choisir parmi les options disponibles?
Réponses:
brièvement, le problème auquel vous êtes confronté est appelé test d'hypothèses multiples . Elle survient lorsque vous testez, comme son nom l'indique, plusieurs hypothèses en même temps.
Disons que vous avez une probabilité donnée de rejeter incorrectement l'hypothèse nulle (faux positif) pour un test, disons 5%. À mesure que vous augmentez le nombre d'ensembles de données que vous testez (dans ce cas, chacun des ensembles auxquels vous appliquez la statistique Moran locale), la probabilité d'observer un faux positif dans n'importe quel ensemble de données augmentera, indépendamment du fait que la probabilité d'observer un faux positif pour un seul ensemble de données est le même.
Il existe de nombreuses «corrections» possibles, qui sont celles que vous avez trouvées, pour corriger ce problème; si vous avez vraiment besoin d'une statistique locale, vous ne pouvez pas l'esquiver. Sinon, vous pouvez utiliser la statistique globale comme une seule hypothèse.
la source