Je construis un modèle dans lequel plusieurs de mes covariables vivent sur un "cercle", dans le sens où elles prennent des valeurs dans l'intervalle [0,1), et 0 = 1. Je m'interroge sur les techniques pour faire face à cette situation. Une idée est de représenter une variable circulaire thêta comme une paire de variables (sin (thêta), cos (thêta)). Avez-vous des réflexions sur cette approche ou de meilleures approches?
J'utilise spécifiquement les GAM du package mgcv. Existe-t-il un moyen de dire au modèle que certaines pièces additives devraient avoir les mêmes valeurs aux points limites? Un autre paquet?
Merci!
circular
package qui peut éventuellement être intéressant. J'espère que vous obtiendrez de meilleures réponses.Réponses:
Il existe deux façons de traiter les variables circulaires, une méthode hacky serait de dupliquer manuellement votre ensemble de données de chaque côté des conditions aux limites, mais la solution la plus élégante à mon avis serait d'utiliser les fonctions de base de spline intégrées avec des conditions aux limites périodiques !
Par exemple:
bs="cc"
spécifie une spline de régression cubique cyclique (voircyclic.cubic.spline
). c'est-à-dire une spline de régression cubique pénalisée dont les extrémités correspondent, jusqu'à la dérivée seconde.Splines sur la sphère
bs="sos"
. Ce sont des splines bidimensionnelles sur une sphère. Les arguments sont la latitude et la longitude, et ils sont l'analogue des splines à plaques minces pour la sphère. Utile pour les données échantillonnées sur une grande partie du globe, lorsque l'isotropie est appropriée. VoirSpherical.Spline
pour plus de détails.bs="cp"
donne une version cyclique d'une spline Pla source
Vous voudrez peut-être examiner Gill et Hangartner (2010). Données circulaires en science politique et comment les gérer . Ils parlent de divers modèles de données circulaires / horloge / saisonnières, et Jeff Gill fournit le code R pour le papier que vous pouvez consulter pour vous inspirer. Il devrait y avoir une version de présentation de ce matériel qui tisse la méthodologie et le code R ensemble.
la source