J'ai besoin de résoudre un problème de régression compliqué sur le disque de l'unité. La question d'origine a suscité quelques commentaires intéressants, mais malheureusement aucune réponse. En attendant, j'ai appris quelque chose de plus sur ce problème, donc je vais essayer de diviser le problème d'origine en sous-problèmes, et voir si j'ai plus de chance cette fois.
J'ai 40 capteurs de température régulièrement espacés dans un anneau étroit à l'intérieur du disque de l'unité:
Ces capteurs acquièrent la température dans le temps. Cependant, comme la variation temporelle est beaucoup plus petite que la variation spatiale, simplifions le problème en ignorant la variabilité temporelle et supposons que chaque capteur ne me donne qu'une moyenne temporelle. Cela signifie que j'ai 40 échantillons (un pour chaque capteur) et je n'ai pas d'échantillons répétés.
Je voudrais construire une surface de régression partir des données du capteur. La régression a deux objectifs:
- J'ai besoin d'estimer un profil de température radiale moyenne . Avec la régression linéaire, j'estime déjà une surface qui est la surface de température moyenne, donc je n'ai besoin que d'intégrer ma surface par rapport à θ , non? Si j'utilise des polynômes pour la régression, cette étape devrait être un jeu d'enfant.
- J'ai besoin d'estimer un profil de température radial , de sorte qu'à chaque position radiale, P ( T ( ρ ) < T 95 ( ρ ) ) = 0,95 .
Compte tenu de ces deux objectifs, quelle technique dois-je utiliser pour la régression sur le disque de l'unité? Bien sûr, les processus gaussiens sont couramment utilisés pour la régression spatiale. Cependant, la définition d'un bon noyau pour le disque unitaire n'est pas triviale, donc je voudrais garder les choses simples et utiliser des polynômes, sauf si vous pensez que c'est une stratégie perdante. J'ai lu des polynômes Zernike . Les polynômes de Zernike semblent être appropriés pour la régression sur le disque unitaire, car ils sont périodiques en .
Une fois le modèle choisi, je dois choisir une procédure d'estimation. Puisqu'il s'agit d'un problème de régression spatiale, les erreurs à différents endroits doivent être corrélées. Les moindres carrés ordinaires supposent des erreurs non corrélées, donc je suppose que les moindres carrés généralisés seraient plus appropriés. GLS semble une technique statistique relativement courante, étant donné qu'il existe une gls
fonction dans la distribution R standard. Cependant, je n'ai jamais utilisé GLS et j'ai des doutes. Par exemple, comment estimer la matrice de covariance? Un exemple élaboré, même avec seulement quelques capteurs, serait formidable.
PS J'ai choisi d'utiliser les polynômes Zernike et GLS car cela me semble la chose logique à faire ici. Cependant, je ne suis pas un expert, et si vous pensez que je vais dans la mauvaise direction, n'hésitez pas à utiliser une approche complètement différente.
Réponses:
Je pense que vous êtes sur la bonne voie en pensant à quelque chose comme les polynômes de Zernike. Comme indiqué dans la réponse de jwimberly, il s'agit d'un exemple d'un système de fonctions de base orthogonales sur un disque. Je ne connais pas les polynômes de Zernike, mais de nombreuses autres familles de fonctions orthogonales (y compris les fonctions de Bessel) surgissent naturellement en physique mathématique classique en tant que fonctions propres pour certaines équations différentielles partielles (au moment de la rédaction de cet article, l'animation en haut de ce lien même montre un exemple de tête de tambour vibrant).
En ce qui concerne cette deuxième question, la variabilité des données pourrait en fait aider à résoudre tout problème d'alias, permettant essentiellement à tout mauvais alignement de faire la moyenne des différentes mesures. (En supposant qu'il n'y ait pas de biais systématique ... mais ce serait un problème pour n'importe quelle méthode, sans par exemple un modèle physique pour donner plus d'informations).
Une possibilité serait donc de définir vos fonctions spatiales orthogonales uniquement aux emplacements des capteurs. Ces «fonctions orthogonales empiriques» pourraient être calculées via PCA sur votre matrice de données spatio-temporelles. (Vous pouvez éventuellement utiliser une pondération pour tenir compte des zones de support de capteur variables, mais étant donné la grille polaire uniforme et la cible des moyennes radiales, cela peut ne pas être nécessaire.)
Notez que s'il est des données de modélisation physique disponibles pour les variations « attendues » dans la température, disponible sur une grille de calcul spatio - temporelle dense, puis la même procédure de PCA pourrait être appliquée à ce que les données pour obtenir des fonctions orthogonales. (Ceci est généralement appelé " décomposition orthogonale appropriée " en ingénierie, où il est utilisé pour la réduction du modèle, par exemple un modèle de dynamique des fluides computationnel coûteux peut être distillé pour être utilisé dans d'autres activités de conception.)
Un dernier commentaire, si vous deviez pondérer les données du capteur par zone de support (c'est-à-dire la taille des cellules polaires), ce serait un type de covariance diagonale, dans le cadre de GLS . (Cela s'appliquerait davantage à votre problème de prédiction, bien que l'ACP pondérée soit étroitement liée.)
J'espère que ça aide!
Mise à jour: Votre nouveau diagramme de la distribution des capteurs change considérablement les choses à mon avis. Si vous voulez estimer les températures à l'intérieur du disque, vous aurez besoin d'un préalable beaucoup plus informatif qu'un simple "ensemble de fonctions orthogonales sur le disque de l'unité". Il y a trop peu d'informations dans les données du capteur.
Si vous voulez en effet estimer la variation de température spatiale sur le disque, la seule façon raisonnable que je puisse voir serait de traiter le problème comme celui de l'assimilation des données . Ici, vous devez au moins contraindre la forme paramétrique de la distribution spatiale en fonction de certaines considérations basées sur la physique (celles-ci peuvent provenir de simulations ou de données associées dans des systèmes ayant une dynamique similaire).
Je ne connais pas votre application particulière, mais si c'est quelque chose comme ça , alors j'imagine qu'il y a une littérature d'ingénierie complète sur laquelle vous pouvez vous baser pour choisir les contraintes préalables appropriées. (Pour ce type de connaissance détaillée du domaine, ce n'est probablement pas le meilleur site StackExchange sur lequel demander.)
la source
la source