Pourquoi le test de Mantel est-il préféré à celui de Moran?

37

Le test de Mantel est largement utilisé dans les études biologiques pour examiner la corrélation entre la distribution spatiale des animaux (position dans l'espace) et, par exemple, leur relation génétique, leur taux d'agression ou un autre attribut. Beaucoup de bons journaux l'utilisent ( PNAS, comportement animal, écologie moléculaire ...). etc.).

J'ai fabriqué des motifs qui peuvent se produire dans la nature, mais le test de Mantel semble être totalement inutile pour les détecter. Par contre, Moran a eu de meilleurs résultats (voir les valeurs de p sous chaque graphique) .

Pourquoi les scientifiques n'utilisent-ils pas Moran I? Y a-t-il une raison cachée que je ne vois pas? Et s'il y a une raison, comment puis-je savoir (comment les hypothèses doivent être construites différemment) d'utiliser correctement le test de Mantel ou de Moran I? Un exemple concret sera utile.

Imaginez cette situation: il y a un verger (17 x 17 arbres) avec un corbeau sur chaque arbre. Les niveaux de "bruit" pour chaque corbeau sont disponibles et vous voulez savoir si la distribution spatiale des corbeaux est déterminée par le bruit qu'ils produisent.

Il y a (au moins) 5 possibilités:

  1. "Oiseaux d'une plume volent ensemble." Plus les corbeaux sont similaires, plus la distance géographique qui les sépare (grappe unique) est faible .

  2. "Oiseaux d'une plume volent ensemble." Encore une fois, plus les corbeaux sont similaires, plus la distance géographique qui les sépare (groupes multiples) est faible, mais un groupe de corbeaux bruyants n’a aucune connaissance de l’existence du deuxième groupe (sinon ils se fondraient en un seul groupe).

  3. "Tendance monotone."

  4. "Les contraires s'attirent." Des corbeaux semblables ne peuvent pas se supporter.

  5. "Modèle aléatoire." Le niveau de bruit n'a pas d'effet significatif sur la distribution spatiale.

Pour chaque cas, j'ai créé un graphique de points et utilisé le test de Mantel pour calculer une corrélation (il n'est pas surprenant que ses résultats soient non significatifs, je n'essaierais jamais de trouver une association linéaire entre de tels modèles de points).

entrez la description de l'image ici


Exemple de données: (compressé autant que possible)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Création d'une matrice de distances géographiques (pour Moran, I est inversé):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Création de parcelle:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS dans les exemples du site d’aide statistique de UCLA, les deux tests sont utilisés avec exactement les mêmes données et avec la même hypothèse, ce qui n’est pas très utile (cf. Test de Mantel , Moran I ).

Réponse à la messagerie instantanée Vous avez écrit:

... il [Mantel] vérifie si les corbeaux calmes sont situés près d'autres corbeaux calmes, alors que les corbeaux bruyants ont des voisins bruyants.

Je pense qu'une telle hypothèse ne pourrait PAS être testée par le test de Mantel . L'hypothèse est valable sur les deux parcelles. Mais si vous supposez qu'un groupe de corbeaux non bruyants peut ne pas avoir connaissance de l'existence d'un second groupe de corbeaux non bruyants, le test de Mantels est à nouveau inutile. Une telle séparation devrait être très probable dans la nature (principalement lorsque vous collectez des données à plus grande échelle).

entrez la description de l'image ici

Ladislav Naďo
la source

Réponses:

19

Test de Mantel et de Moran, je me réfère à deux concepts très différents.

La raison pour utiliser le I de Moran est la question de l'autocorrélation spatiale: corrélation d'une variable avec elle-même à travers l'espace. On utilise I de Moran quand on veut savoir dans quelle mesure la survenue d'un événement dans une unité surfacique rend plus probable ou peu probable la survenue d'un événement dans une unité surfacique voisine. En d'autres termes (en utilisant votre exemple): s'il y a un corbeau bruyant sur un arbre, quelle est la probabilité ou peu probable qu'il y ait d'autres corbeaux bruyants dans le quartier? L'hypothèse nulle de I de Moran n'est pas une autocorrélation spatiale dans la variable d'intérêt.

L’utilisation du test de Mantel est motivée par la question des similitudes ou des différences entre les variables. On utilise le test de Mantel quand on veut savoir si des échantillons similaires en termes de variables prédictives (d'espace) tendent également à être similaires en termes de variable dépendante (d'espèce). Pour le dire simplement: les échantillons rapprochés sont-ils également similaires sur le plan de la composition et les échantillons éloignés dans le temps sont-ils également différents sur le plan de la composition? En utilisant votre exemple: il vérifie si les corbeaux calmes sont situés près d'autres corbeaux calmes, alors que les corbeaux bruyants ont des voisins bruyants. L'hypothèse nulle n'est pas une relation entre la localisation spatiale et le DV.
De plus, le test partiel de Mantel permet de comparer deux variables tout en en contrôlant une troisième.
Par exemple, il faut le test de Mantel pour comparer

  • Deux groupes d'organismes, qui forment le même ensemble d'unités d'échantillonnage;
  • Structure de la communauté avant et après le dérangement;
  • Distance génétique / écologique et distance géographique.

Voici une bonne discussion sur le test Mantel et son application.

(Edité en réponse aux nouveaux exemples de Ladislav Nado)

Si je peux deviner, la raison de votre confusion est que vous continuez à penser à l'espace et au bruit dans vos exemples, soit comme deux variables continues, soit comme une matrice de distance (position dans l'espace) et une variable continue (bruit). En fait, pour analyser les similitudes entre deux de ces variables, il convient de les considérer toutes les deux comme des matrices de distance . C'est:

  • une matrice (par exemple, pour l'espace) décrit les différences pour chaque paire de coordonnées géographiques. La valeur pour 2 corbeaux assis l'un à côté de l'autre est inférieure à celle des corbeaux éloignés l'un de l'autre;
  • une autre matrice (pour les structures environnementales, génétiques ou autres) décrit les différences entre les résultats mesurés à des points donnés. La valeur pour 2 corbeaux avec un niveau de bruit similaire (peu importe qu'ils soient calmes ou bruyants - c'est simplement une mesure de similarité!) Est inférieure à la valeur pour une paire de corbeaux avec des niveaux de bruit différents.

Ensuite, le test de Mantel calcule le produit croisé des valeurs correspondantes dans ces deux matrices. Permettez-moi de souligner à nouveau que la statistique de Mantel est la corrélation entre deux matrices de distance et n’est pas équivalente à la corrélation entre les variables utilisées pour former ces matrices.

Prenons maintenant deux structures que vous avez montrées dans les images A et B.
Dans l’image A, la distance dans chaque paire de corbeaux correspond à des similitudes dans leur niveau de bruit. Les corbeaux avec de petites différences dans leur niveau de bruit (chaque corbeau silencieux contre un autre corbeau silencieux, chaque corbeau bruyant contre un autre corbeau bruyant) restent proches, tandis que chaque paire de corbeaux avec une grande différence de niveau de bruit (un corbeau calme vs un corbeau bruyant) éloignez-vous les uns des autres. Le test de Mantel montre correctement qu'il existe une corrélation spatiale entre les deux matrices.
Dans l' image B, cependant, la distance entre les corbeaux ne pascorrespondent aux similitudes dans leur niveau de bruit. Bien que tous les corbeaux bruyants restent ensemble, des corbeaux silencieux peuvent rester ou ne pas rester à proximité. En fait, la distance dans certaines paires de corbeaux dissemblables (un calme et un bruyant) est inférieure à la distance pour certaines paires de corbeaux similaires (lorsque les deux sont calmes).
Sur la photo B, rien n’indique que si un chercheur choisit deux corbeaux similaires au hasard, ils seraient voisins. Rien ne prouve que si un chercheur choisit deux corbeaux voisins (ou pas si éloignés) au hasard, ils seraient similaires. Par conséquent, la revendication initiale qui On both plots the hypothesis validest incorrecte. La structure comme dans l'image B ne montre aucune corrélation spatiale entre les deux matrices et échoue donc au test de Mantel.

Bien entendu, différents types de structures (avec un ou plusieurs groupes d'objets similaires ou sans aucune frontière claire entre les groupes) existent dans la réalité. Et le test Mantel est parfaitement applicable et très utile pour tester ce qu’il teste. Si je peux recommander une autre bonne lecture, cet article utilise des données réelles et discute des tests de Moran I, Geary's c et de Mantel en termes assez simples et compréhensibles.

J'espère que tout est un peu plus clair maintenant; Cependant, je peux développer cette explication si vous sentez qu'il manque quelque chose.

JE SUIS
la source
1
merci pour votre réponse, mais je pense que l'hypothèse que vous écrivez (de l'hypothèse du test de Mantel dans la vie réelle) n'est pas utile avec des données réelles. J'ajoute ma réponse à vous ci-dessus, je serai très heureux si vous répondez à ce sujet. Peut-être que je me trompe.
Ladislav Naďo
@Ladislav Nado J'ai mis à jour la réponse. S'il vous plaît n'hésitez pas à demander plus d'explications, si nécessaire.
IM
Merci beaucoup, quand j'ai "mâché" les articles que vous avez recommandés, j'ai finalement compris.
Ladislav Naďo
1
@LadislavNado Génial! Heureux d'avoir pu aider.
IM