Régression multiple dans les statistiques directionnelles / circulaires?

9

J'essaie de développer un modèle prédictif pour une variable dépendante angulaire (sur utilisant plusieurs mesures indépendantes - également des variables angulaires, sur - comme prédicteurs. Chaque prédicteur est significativement mais pas extrêmement fortement corrélé avec la variable dépendante. Comment puis-je combiner les prédicteurs pour déterminer un modèle prédictif pour la variable dépendante qui est optimal dans un certain sens? Et comment puis-je identifier rigoureusement le ou les prédicteurs les plus solides?[0,2π])[0,2π]

Pour les variables sur les espaces euclidiens, j'utiliserais une régression multiple (ou similaire) et une analyse en composantes principales. Mais la périodicité de toutes les variables déçoit avec ces approches, par exemple, 0,02 doit être fortement corrélée avec 6,26, mais pas avec 3,14. Comment les procédures "habituelles" sont-elles généralisées aux statistiques directionnelles / circulaires? Toute idée ou citation de références utiles serait utile. (Je connais déjà les textes de N. Fisher et Mardia & Jupp, mais je n'y ai pas accès.)

user44436
la source

Réponses:

5

Dans le livre que j'ai, il est dit que ce n'est que récemment que certains articles ont commencé à explorer la régression multivariée où une ou plusieurs variables sont circulaires. Je ne les ai pas vérifiés moi-même, mais les sources pertinentes semblent être:

Bhattacharya, S. et SenGupta, A. (2009). Analyse bayésienne des modèles semi-paramétriques linéaires-circulaires. Journal of Agricultural, Biological and Environmental Statistics , 14, 33-65.

Lund, U. (1999). Régression de la moindre distance circulaire pour les données directionnelles. Journal of Applied Statistics , 26, 723-733

Lund, U. (2002). Régression arborescente ou réponse circulaire. Communications in Statistics - Theory and Methods , 31, 1549-1560.

Qin, X., Zhang, J.-S., et Yan, X.-D. (2011). Un modèle de régression multivariée circulaire-linéaire non paramétrique avec un sélecteur de largeur de bande de règle du pouce. Ordinateurs et mathématiques avec applications , 62, 3048-3055.


Dans le cas d'une réponse circulaire, vous n'avez qu'un seul régresseur circulaire (ce que je comprends que ce n'est pas le cas pour vous, mais peut-être que des régressions distinctes seraient également intéressantes), il existe un moyen d'estimer le modèle. [1] recommander l'ajustement du modèle linéaire général

cos(Θj)=γ0c+k=1m(γckccos(kψj)+γskcsin(kψj))+ε1j,
sin(Θj)=γ0s+k=1m(γckscos(kψj)+γskssin(kψj))+ε2j.

La chose bonne est que ce modèle peut être estimée en utilisant la fonction lm.circular de la bibliothèque R circulaire .

[1] Jammalamadaka, SR et SenGupta, A. (2001). Sujets en statistiques circulaires . World Scientific, Singapour.

Julius Vainora
la source
1

Vous pouvez consulter ces articles qui traitent de la régression multiple lorsque la variable dépendante est circulaire ou sphérique. L'approche est basée sur la distribution normale projetée.

Hernandez-Stumpfhauser, Daniel, F. Jay Breidt et Mark J. van der Woerd. "La distribution normale générale projetée de dimension arbitraire: modélisation et inférence bayésienne." Analyse bayésienne 12.1 (2017): 113-133.

Wang, Fangpo et Alan E. Gelfand. "Analyse directionnelle des données sous la distribution normale générale projetée." Méthodologie statistique 10.1 (2013): 113-127

Nuñez-Antonio, Gabriel, Eduardo Gutiérrez-Peña et Gabriel Escarela. "Un modèle de régression bayésien pour les données circulaires basé sur la distribution normale projetée." Modélisation statistique 11.3 (2011): 185-201.

Presnell, Brett, Scott P. Morrison et Ramon C. Littell. "Modèles linéaires multivariés projetés pour les données directionnelles." Journal de l'American Statistical Association 93.443 (1998): 1068-1077.

Ce dernier a été le premier à sortir en utilisant cette approche normale projetée

user160744
la source