J'ai un ensemble de données qui comprend 247 pièges à moustiques placés dans des positions fixes et échantillonnés chaque semaine pendant 23 semaines. J'ai également des données sur l'incidence de la dengue (indexées sur l'adresse du domicile) au cours de la même période. J'aimerais voir s'il existe une corrélation spatiale et spatio-temporelle entre le taux de capture des moustiques à chaque emplacement de piège et l'incidence des cas de dengue. J'ai déjà essayé le Global Moran's I et Local Moran's I in R et SaTScan Multivariate espace-temps. Aucun de ceux-ci ne semble me donner ce que je veux. Suis-je en train de chercher le bon endroit et de le faire mal ou y a-t-il de meilleures analyses que je peux exécuter?
Merci beaucoup pour le conseil!! Amy Green
la source
Réponses:
Je suppose que vous essayez d'estimer l'efficacité du piégeage pour réduire l'incidence de la contraction de la dengue. Vous voudrez peut-être jeter un œil aux tests d'interaction espace-temps.
PySAL a un certain nombre d'implémentations dans son module spatial_dynamics.
la source
Les données sur les moustiques sont-elles des chiffres? ou quel type de variables vous souvenez-vous de ces pièges? J'ai vu une étude où ils utilisent MaxEnt pour prédire la leishmanie au Mexique pour les 20 prochaines années en utilisant uniquement la présence des emplacements de la maladie comme données. Je ne pense pas que ce soit très fiable, mais c'est un point de départ et il y a eu de nombreux développements. Que recherchez-vous? Une sorte de krigeage vous permettrait de comprendre la variabilité spatiale de vos variables. Vous pouvez même exécuter des simulations si vous obtenez des modèles qui correspondent bien. Je suis presque sûr qu'il existe des techniques de krigeage qui fonctionnent dans un contexte spatio-temporel mais je ne les ai jamais utilisées. Une recherche rapide sur google devrait jeter quelques références. 23 semaines, ce n'est pas beaucoup de points de données pour l'analyse des séries chronologiques, mais vous pouvez l'essayer, le paquet R bfast vous permet de détecter des ruptures brusques dans le comportement d'une série chronologique, peut-être pouvez-vous détecter ces anomalies et les associer à des poussées de dengue. Je pense que vous devez produire une meilleure description de votre problème et des résultats d'étude souhaités.
la source
Difficile à dire sans voir vos données et travailler à travers une analyse exploratoire. Des détails supplémentaires sur l'hypothèse, le plan d'échantillonnage et les données réelles collectées seraient les bienvenus. Lorsque vous posez des questions de méthodologie statistique, il est important d'indiquer l'hypothèse que vous testez. Cela peut dicter une méthodologie statistique et sans le savoir, nous tournons dans le noir.
Il n'est pas du tout clair non plus quel est le problème avec les statistiques spécifiées par rapport à "ne pas me donner ce que je veux". Je ne sais pas ce que vous attendiez avec une statistique d'autocorrélation univariée indiquant une corrélation spatiale bivariée. La famille de statistiques SCAN est assez variable avec de nombreuses distributions définies disponibles. Quelle distribution (modèle) avez-vous définie dans SaTScan et avez-vous réellement une hypothèse et des données adaptées à une analyse de modèle de points? En général, un échantillon quadrillé et systématique n'est pas approprié pour une analyse de modèle de points.
Une corrélation serait très limitative d'un point de vue inférentiel et il semblerait qu'un mode de type régression soit ici de mise. À première vue, je pense qu'un modèle à effets mixtes avec un terme AR-I pour le temps et un terme d'autocorrélation pour les effets spatiaux aléatoires conviendrait à vos besoins. Cela vous permettrait de partitionner la variation dans le temps et de normaliser toute influence que l'autocorrélation aurait sur l'erreur résiduelle et les hypothèses iid. Une autre option, si les données le supportaient, serait un modèle de processus ponctuel de Poisson dans un cadre MCMC. S'il est spécifié comme modèle hiérarchique, vous pouvez définir l'heure comme une priorité. Avec une approche de régression du noyau, vous pouvez tester plusieurs hypothèses de processus de diffusion spatiale ou définir un terme de diffusion quadratique. Ce type de modèle est couramment utilisé en épidémiologie spatiale pour obtenir un taux de propagation.
Il est facile de se perdre en «jetant vos données contre le mur» avec des approches statistiques spatiales, mais, à moins que votre plan d'échantillonnage soit destiné à capturer le processus spatial et que vous ayez une question bien formulée concernant l'effet spatial, cela peut être un exercice futile.
En raison de la disponibilité facile des méthodologies, les méthodes fréquentistes sont souvent négligées. Il existe des modèles de régression qui peuvent facilement traiter des données spatiales (autorégressives spatiales et conditionnelles, régression spatiale, régression polynomiale, modèles à effets mixtes, régression canonique, régression du noyau, régressions semi et non paramétriques, ...) et si vous avez l'intention de déduisez-les en fonction de votre hypothèse.
la source