J'essaie d'adapter un modèle à l'aide des données de vent (0, 359) et de l'heure (0, 23), mais je crains qu'ils ne s'intègrent mal dans une régression linéaire car ce ne sont pas eux-mêmes des paramètres linéaires. Je voudrais les transformer en Python. J'ai vu une certaine mention du calcul d'un vecteur moyen en prenant le sin et le cos des degrés, au moins dans le cas du vent, mais pas beaucoup.
Existe-t-il une bibliothèque Python ou une méthode pertinente qui pourrait être utile?
regression
python
circular-statistics
compguy24
la source
la source
Réponses:
ou
selon exactement comment le temps a été enregistré ou doit être interprété.
Parfois, la nature ou la société est obligeante et la dépendance à la variable circulaire prend la forme d'une direction optimale pour la réponse et la direction opposée (la moitié du cercle plus loin) étant pessimale. Dans ce cas, un seul terme sinus et cosinus peut suffire; pour les modèles plus compliqués, vous aurez peut-être besoin d'autres termes. Pour plus de détails, un tutoriel sur cette technique de régression circulaire, de Fourier, périodique, trigonométrique peut être trouvé ici , avec à son tour d'autres références. La bonne nouvelle est qu'une fois que vous avez créé des termes sinus et cosinus, ils ne sont que des prédicteurs supplémentaires dans votre régression.
Il existe une grande littérature sur les statistiques circulaires, elles-mêmes considérées comme faisant partie des statistiques directionnelles. Curieusement, cette technique n'est souvent pas mentionnée, car la littérature se concentre généralement sur les variables de réponse circulaire. La récapitulation des variables circulaires par leurs moyennes vectorielles est une méthode descriptive standard mais n'est pas requise ni directement utile pour la régression.
Certains détails sur la terminologie La direction et l'heure du vent sont en termes statistiques des variables, pas des paramètres, quelle que soit l'utilisation dans votre branche scientifique.
Commentaire fortuit Pour une variable de réponse telle que la concentration de particules, je m'attendrais à utiliser un modèle linéaire généralisé avec un lien logarithmique pour assurer des prédictions positives.
la source