L'addition, la soustraction, la multiplication et la division de variables aléatoires normales sont bien définies, mais qu'en est-il des opérations trigonométriques?
Par exemple, supposons que j'essaie de trouver l'angle d'une cale triangulaire (modélisée comme un triangle à angle droit) avec les deux cathètes ayant les dimensions et , toutes deux décrites comme des distributions normales.
Les deux l' intuition et de la simulation me disent que la distribution résultante est normale, avec une moyenne . Mais existe-t-il un moyen de calculer la distribution de l'angle résultant? Références sur l'endroit où je trouverais la réponse?
(Pour un peu de contexte, je travaille sur la tolérance statistique des pièces mécaniques. Ma première impulsion serait de simuler tout le processus, de vérifier si le résultat final est raisonnablement normal et de calculer l'écart-type. Mais je me demande s'il peut y avoir une approche analytique plus nette.)
Réponses:
Dans cette interprétation, le triangle est un triangle rectangle de longueurs latérales et Y distribuées binormalement avec des attentes μ x et μ y , des écarts types σ x et σ y et une corrélation ρ . Nous recherchons la distribution de l' arctan ( Y / X ) . À cette fin, normalisez X et Y afin queX Y μx μy σx σy ρ arctan(Y/X) X Y
et Y = σ y η + μ y
avec et η la normale normale varie avec la corrélation ρ . Soit θ un angle et pour plus de commodité, écrivez q = tan ( θ ) . alorsξ η ρ θ q=tan(θ)
Le côté gauche, étant une combinaison linéaire de normales, est normal, avec une moyenne et une variance σ 2 y + q 2 σ 2 x - 2 q ρ σ x σ y .μyσy−qμxσx σ2y+q2σ2x−2qρσxσy
La différenciation du cdf normal de ces paramètres par rapport à donne le pdf de l'angle. L'expression est assez macabre, mais une partie clé de celle-ci est l'exponentielleθ
montrant tout de suite que l'angle n'est pas normalement distribué. Cependant, comme le montrent vos simulations et votre intuition, cela devrait être à peu près normal à condition que les variations des longueurs des côtés soient faibles par rapport aux longueurs elles-mêmes. Dans ce cas, une approximation Saddlepoint devrait donner de bons résultats pour des valeurs spécifiques de , μ y , σ x , σ y et ρ , même si une solution générale de forme fermée n'est pas disponible. L'écart type approximatif disparaîtra dès la découverte de la dérivée seconde (par rapport à θμx μy σx σy ρ θ ) du logarithme du pdf (comme indiqué dans les équations (2.6) et (3.1) de la référence). Je recommande un système d'algèbre informatique (comme MatLab ou Mathematica) pour réaliser cela!
la source
Vous regardez des statistiques circulaires et en particulier une distribution circulaire appelée distribution normale projetée .
Pour une raison quelconque, ce sujet peut être un peu difficile à google, mais les deux principaux textes sur les statistiques circulaires sont l'analyse statistique des données circulaires par Fisher et les statistiques directionnelles par Mardia et Jupp.
Pour une analyse approfondie de la distribution normale projetée, voir page 46 de Mardia et Jupp. Il existe des expressions de forme fermée (jusqu'à l'intégrale de la fonction d'erreur) pour la distribution, et comme l'a suggéré Whuber, elle ressemble à la normale lorsque sa `` variance '' (attention ici, que signifie la variance pour une variable aléatoire sur un cercle? !) est petite, c'est-à-dire lorsque la distribution est assez concentrée en un point (ou direction ou angle).
la source