Je collabore actuellement une liste de spécimens de bases de données de divers musées d'histoire naturelle pour des recherches plus approfondies. Cependant, un problème bien connu associé à la majorité des données historiques est le manque de latitude et de longitude appropriées, ce qui empêche d'utiliser ces données.
Il y a eu des moyens de surmonter ces données - comme dessiner un tampon autour d'une région et fournir une gamme d'incertitude associée à cet emplacement.
Par exemple, la fonction - biogéomancien du package «spatial» dans R, automatise le processus de géoréférencement, à condition qu'il existe quelques descriptions textuelles telles que «2 miles à l'ouest de XYZ». Voir la documentation ici.
Cependant, ma principale préoccupation est d'utiliser un tel protocole pour des régions de 200 km2. Existe-t-il un moyen de surmonter ce problème? Je serais ravi d'utiliser ce riche trésor de données muséales, à condition de pouvoir gérer l'incertitude associée à son emplacement.
Un exemple de quelques spécimens dans mon jeu de données est montré ci-dessous. Veuillez noter que beaucoup d'entre eux sont accompagnés de mentions d'élévation, mais la plupart des enregistrements sont très vagues.
ÉDITER
Dans la section des commentaires, l'un d'entre vous a mentionné le but de cette question et ce que j'ai tendance à en tirer.
1. Je voudrais savoir comment une fois peut réduire le rayon d'incertitude d'une région polygonale vraiment large à un rayon d'incertitude plus petit (si possible).
2. Ces informations m'aideront à réaliser de futures analyses spatiales telles que la modélisation de la répartition des espèces / modélisation de l'occupation par exemple.
la source
Réponses:
Tenez compte des dates des événements et essayez d'obtenir (construction, géoréférencement) une carte des routes, des voies ferrées, des ponts et des villes (villages, gares) connues ou disponibles à cette époque pour la région, car le naturaliste part généralement de un village connu et utiliser au moins partiellement une route ou un chemin de fer existant pour se rendre dans les zones où ils ont obtenu les spécimens. Parfois, cela réduit vraiment la zone probable de collecte / d'occurrence. S'il y a plus d'informations écologiques sur l'espèce, vous pouvez exclure des zones, par exemple. terres ouvertes vs forêts, zones humides vs zones sèches, avec également quelques informations auxiliaires sur la distribution historique de ces écosystèmes.
Bien que je n'utiliserais définitivement pas ces emplacements pour entraîner le modèle sdm, vous pouvez utiliser les résultats du modèle pour réduire l'incertitude de l'emplacement de ces occurrences mal géoréférencées en combinaison avec les données mentionnées ci-dessus.
Certains articles récents traitent de l'effet de biais de ces emplacements incertains et, si l'utilisation de données environnementales résumées peut être utilisée pour compenser cet emplacement flou:
Où l'incertitude de position est-elle un problème pour la modélisation de la distribution des espèces? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x
Quantifier le degré de biais lié à l'utilisation de données à l'échelle du comté dans la modélisation de la répartition des espèces: l'augmentation de la taille de l'échantillon ou l'utilisation de données environnementales moyennes par comté peut-elle réduire la sur-prédiction de distribution? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/
la source