Quelqu'un m'a posé cette question lors d'un entretien d'embauche et j'ai répondu que leur distribution commune est toujours gaussienne. Je pensais que je pouvais toujours écrire une gaussienne à deux variables avec leurs moyennes, leur variance et leurs covariances. Je me demande s’il peut exister un cas pour lequel la probabilité commune de deux gaussiennes ne soit pas gaussienne?
91
Réponses:
La distribution normale à deux variables est l' exception et non la règle!
Il est important de reconnaître que "presque toutes" les distributions jointes avec des marges normales ne sont pas la distribution normale bivariée. C'est-à-dire que le point de vue général selon lequel les distributions jointes avec des marges normales qui ne sont pas la normale bivariée sont en quelque sorte "pathologiques", est un peu erroné.
Certes, la normale multivariée est extrêmement importante en raison de sa stabilité lors de transformations linéaires, et fait donc l'objet de toutes les attentions dans les applications.
Exemples
Il est utile de commencer par quelques exemples. La figure ci-dessous contient des cartes thermiques de six distributions à deux variables, qui ont toutes des marges normales normales. Les valeurs de gauche et du milieu dans la rangée supérieure sont des normales à deux variables, les autres ne le sont pas (comme cela devrait être évident). Ils sont décrits plus en détail ci-dessous.
Les os nus des copules
Les propriétés de dépendance sont souvent efficacement analysées à l'aide de copules . Une copule bivariée est juste un nom de fantaisie pour une distribution de probabilité sur le carré unité avec des marginales uniformes .[0,1]2
Supposons que est une copule bivariée. Ensuite, immédiatement à partir de ce qui précède, nous savons que C ( u , v ) ≥ 0 , C ( u , 1 ) = u et C ( 1 , v ) = v , par exemple.C(u,v) C(u,v)≥0 C(u,1)=u C(1,v)=v
Nous pouvons construire des variables aléatoires bivariées sur le plan euclidien avec des marginales prédéfinies par une simple transformation d'une copule bivariée. Soit et F 2 des distributions marginales prescrites pour une paire de variables aléatoires ( X , Y ) . Alors, si C ( u , v ) est une copule à deux variables, F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) )F1 F2 ( X, Y) C( u , v )
Pour et F 2 continus , le théorème de Sklar affirme une réciproque impliquant l'unicité. En d’autres termes, étant donné une distribution bivariée F ( x , y ) avec des marges continues F 1 , F 2 , la copule correspondante est unique (sur l’espace de plage approprié).F1 F2 F(x,y) F1 F2
La normale bivariée est exceptionnelle
Le théorème de Sklar nous dit (essentiellement) qu'il n'y a qu'une seule copule qui produit la distribution normale bivariée. Ceci est, bien son nom, la copule gaussienne qui a une densité sur c ρ ( u , v ) : = ∂ 2[0,1]2
Où le numérateur est la distribution normale bidimensionnelle avec corrélation ρ évaluée à Φ - 1 ( u ) et Φ - 1 ( v ) .
Cependant, il existe de nombreuses autres copules et chacune d'entre elles donnera une distribution à deux variables avec des marges normales qui ne correspond pas à la normale à deux variables en utilisant la transformation décrite dans la section précédente.
Quelques détails sur les exemples
Notez que si est am arbitraire copule avec une densité c ( u , v ) , la densité bidimensionnelle correspondant aux marginaux standards normaux en vertu de la transformation F ( x , y ) = C ( Φ ( x ) , Φ ( y ) ) est f ( x , y ) = φ ( x ) φ (C( u , v ) c ( u , v ) F( x , y) = C(Φ(x),Φ(y))
Notez qu'en appliquant la copule gaussienne dans l'équation ci-dessus, nous récupérons la densité normale à deux variables. Mais, pour tout autre choix dec ( u , v ) , nous ne le ferons pas.
Les exemples de la figure ont été construits comme suit (en parcourant chaque ligne, une colonne à la fois):
la source
library(copula)
kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE)))
# force normal margins
evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1)))
contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
Il est vrai que chaque élément d’un vecteur normal multivarié est lui-même normalement distribué, et vous pouvez en déduire leurs moyennes et leurs variances. Cependant, il n’est pas vrai que deux variables aléatoires guassiennes soient conjointement distribuées normalement. Voici un exemple:
Prochain,
Donc,
la source
Le post suivant contient un aperçu d'une preuve, juste pour donner les idées principales et vous aider à démarrer.
Preuve . Trivial, ignoré pour ne pas offenser personne.
la source