Opérations trigonométriques sur les écarts-types

14

L'addition, la soustraction, la multiplication et la division de variables aléatoires normales sont bien définies, mais qu'en est-il des opérations trigonométriques?

Par exemple, supposons que j'essaie de trouver l'angle d'une cale triangulaire (modélisée comme un triangle à angle droit) avec les deux cathètes ayant les dimensions et , toutes deux décrites comme des distributions normales.d1d2

Les deux l' intuition et de la simulation me disent que la distribution résultante est normale, avec une moyenne arctan(mean(d1)mean(d2)). Mais existe-t-il un moyen de calculer la distribution de l'angle résultant? Références sur l'endroit où je trouverais la réponse?

(Pour un peu de contexte, je travaille sur la tolérance statistique des pièces mécaniques. Ma première impulsion serait de simuler tout le processus, de vérifier si le résultat final est raisonnablement normal et de calculer l'écart-type. Mais je me demande s'il peut y avoir une approche analytique plus nette.)

Bossykena
la source
2
Pourriez-vous confirmer que (a) d1 et d2 sont les longueurs latérales (et non les angles); (b) que vous supposez que l'angle entre eux est un angle droit (sinon la formule atan est suspecte); et (c) que vous êtes intéressé par la distribution de l'un des autres angles de ce triangle rectangle? Aussi, vraisemblablement, la SD de chaque distribution de longueur est beaucoup plus petite que son attente car le triangle ne devrait pas avoir de probabilité appréciable d'une longueur de côté négative :-).
whuber
Exact. J'ai reformulé le problème pour le rendre un peu plus clair. Et oui, le SD sera petit par rapport aux dimensions.
Bossykena
En utilisant des formules de multiplication et d'addition, vous pouvez essayer l'expansion de Taylor.
Merci pour vos deux excellentes réponses qui (pour autant que je sache avec mon expertise limitée en statistiques) sont à la fois intuitives et solides.
Bossykena

Réponses:

15

Dans cette interprétation, le triangle est un triangle rectangle de longueurs latérales et Y distribuées binormalement avec des attentes μ x et μ y , des écarts types σ x et σ y et une corrélation ρ . Nous recherchons la distribution de l' arctan ( Y / X ) . À cette fin, normalisez X et Y afin queXYμxμyσxσyρarctan(Y/X)XY

et Y = σ y η + μ y

X=σxξ+μx
Y=σyη+μy

avec et η la normale normale varie avec la corrélation ρ . Soit θ un angle et pour plus de commodité, écrivez q = tan ( θ ) . alorsξηρθq=tan(θ)

P[arctan(Y/X)θ]=P[YqX]

=P[σyη+μyq(σxξ+μx)

=P[σyηqσxξqμxμy]

Le côté gauche, étant une combinaison linéaire de normales, est normal, avec une moyenne et une variance σ 2 y + q 2 σ 2 x - 2 q ρ σ x σ y . μyσyqμxσxσy2+q2σx22qρσxσy

La différenciation du cdf normal de ces paramètres par rapport à donne le pdf de l'angle. L'expression est assez macabre, mais une partie clé de celle-ci est l'exponentielleθ

exp((μy(σy+1)μx(σx+1)tan(θ))22(2ρσxσytan(θ)+σx2+σy2+tan2(θ))),

montrant tout de suite que l'angle n'est pas normalement distribué. Cependant, comme le montrent vos simulations et votre intuition, cela devrait être à peu près normal à condition que les variations des longueurs des côtés soient faibles par rapport aux longueurs elles-mêmes. Dans ce cas, une approximation Saddlepoint devrait donner de bons résultats pour des valeurs spécifiques de , μ y , σ x , σ y et ρ , même si une solution générale de forme fermée n'est pas disponible. L'écart type approximatif disparaîtra dès la découverte de la dérivée seconde (par rapport à θμxμyσxσyρθ) du logarithme du pdf (comme indiqué dans les équations (2.6) et (3.1) de la référence). Je recommande un système d'algèbre informatique (comme MatLab ou Mathematica) pour réaliser cela!

whuber
la source
1
Il n'y avait jamais aucune chance qu'il soit distribué normalement. C'est un angle! Il prend uniquement des valeurs sur . [π,π)
Robby McKilliam
1
P (Y / X q) = P (Y qX) n'est pas correct si X est un rv normal - X peut aussi être négatif.
ronaf
@ronaf: en fait, puisque et Y sont les longueurs latérales d'un triangle physique, nous ne devrions pas avoir un X négatif ! XYX
shabbychef
2
@ronaf: C'est la bonne idée. Si l'on utilise des longueurs de côté signées et considère également l'angle comme une valeur réelle (plutôt que sa valeur modulo ), il n'y a pas d'incohérence avec la normalité dans les deux cas. Votre argument sur l'inégalité qui pourrait être erronée est excellent. Tout ce que je peux faire en réponse est de prétendre que l'équation est une excellente approximation sous les hypothèses faites parce que la probabilité que X ou Y soit négatif est négligeable. 2π
whuber
1
@YBE Je suis d'accord pour dire que le dernier "+" de mon expression ne semble pas appartenir - il pourrait s'être glissé lorsque je nettoyais le balisage TeX. Je n'ai pas de référence car j'ai calculé le dérivé moi-même.
whuber
12

Vous regardez des statistiques circulaires et en particulier une distribution circulaire appelée distribution normale projetée .

Pour une raison quelconque, ce sujet peut être un peu difficile à google, mais les deux principaux textes sur les statistiques circulaires sont l'analyse statistique des données circulaires par Fisher et les statistiques directionnelles par Mardia et Jupp.

Pour une analyse approfondie de la distribution normale projetée, voir page 46 de Mardia et Jupp. Il existe des expressions de forme fermée (jusqu'à l'intégrale de la fonction d'erreur) pour la distribution, et comme l'a suggéré Whuber, elle ressemble à la normale lorsque sa `` variance '' (attention ici, que signifie la variance pour une variable aléatoire sur un cercle? !) est petite, c'est-à-dire lorsque la distribution est assez concentrée en un point (ou direction ou angle).

Robby McKilliam
la source