Exemple de deux variables normales * corrélées * dont la somme n'est pas normale

10

Je connais quelques bons exemples de paires de variables aléatoires corrélées qui sont légèrement normales mais pas conjointement normales. Voir cette réponse de Dilip Sarwate , et celle de Cardinal .

Je connais également un exemple de deux variables aléatoires normales dont la somme n'est pas normale. Voir cette réponse par Macro . Mais dans cet exemple, les deux variables aléatoires ne sont pas corrélées.

Existe-t-il un exemple de deux variables aléatoires normales qui ont une covariance non nulle et dont la somme n'est pas normale? Ou est-il possible de prouver que la somme de deux variables aléatoires normales corrélées, même si elles ne sont pas normales bivariées, doit être normale?

[Contexte: J'ai une question de devoirs qui demande la distribution de où et sont des normales standard avec corrélation . Je pense que la question visait à préciser qu'ils sont normaux bivariés. Mais je me demande si quelque chose peut être dit sans cette hypothèse supplémentaire pour non nul.]X Y ρ ρaX+bYXYρρ

Merci!

mww
la source
5
La réponse de Cardinal, que vous citez, contient déjà une solution: voir le coin supérieur droit dans son panneau d'exemples.
whuber
Pouvez-vous expliquer comment? Il spécifie une distribution conjointe , qui donne deux marginaux normaux. Il n'est pas clair pour moi que la somme des deux marginaux normaux ne soit pas normale, ce que je recherche. (Voir aussi mon commentaire sur la réponse de Glen_b ci-dessous.)
mww
3
De la seule image, il est évident que la densité de la somme à zéro est nulle (car la ligne coupe le tracé en un seul point, qui a la mesure zéro), tandis que la somme elle-même est tout aussi évidemment symétrique par rapport à zéro, montrant que zéro est le centre de la distribution de la somme. Une telle distribution ne peut pas être normale car les distributions normales ont des densités non nulles en leur centre. x+y=0
whuber

Réponses:

11

Presque toutes les copules bivariées produiront une paire de variables aléatoires normales avec une corrélation non nulle (certaines donneront zéro mais ce sont des cas spéciaux). La plupart (presque tous) d'entre eux produiront une somme non normale.

Dans certaines familles de copules, toute corrélation de Spearman (population) souhaitée peut être produite; la difficulté est seulement de trouver la corrélation de Pearson pour les marges normales; c'est faisable en principe, mais l'algèbre peut être assez compliquée en général. [Cependant, si vous avez la corrélation de la population de Spearman, la corrélation de Pearson - au moins pour les marges à queue claire comme la gaussienne - peut ne pas être trop loin d'elle dans de nombreux cas.]

Tous les exemples, sauf les deux premiers du complot de cardinal, devraient donner des sommes non normales.


Quelques exemples - les deux premiers sont tous deux de la même famille de copules que le cinquième des exemples de distributions bivariées du cardinal, le troisième est dégénéré.

Exemple 1:

Copule de Clayton ( )θ=0.7

histogrammes des marges normales, somme non normale et tracé de la distribution bivariée

Ici, la somme est très distinctement culminée et assez fortement asymétrique à droite

 

Exemple 2:

Copule de Clayton ( )θ=2

histogrammes des marges normales, somme non normale et tracé de la distribution bivariée

Ici, la somme est légèrement asymétrique. Juste au cas où ce ne serait pas tout à fait évident pour tout le monde, ici j'ai inversé la distribution (c'est-à-dire que nous avons un histogramme de en violet pâle) et je l'ai superposé pour que nous puissions voir l'asymétrie plus clairement:(x+y)

histogramme superposé de x + y et - (x + y)

 

Nous pourrions facilement échanger la direction d'asymétrie de la somme de sorte que la corrélation négative soit assortie à l'inclinaison gauche et la corrélation positive avec l'inclinaison droite (par exemple, en prenant et dans chacun des les cas ci-dessus - la corrélation des nouvelles variables serait la même qu'auparavant, mais la distribution de la somme serait inversée autour de 0, inversant l'asymétrie).X=XY=Y

D'un autre côté, si nous nions simplement l'un d'eux, nous changerions l'association entre la force de l'asymétrie et le signe de la corrélation (mais pas la direction de celle-ci).

Cela vaut également la peine de jouer avec quelques copules différentes pour avoir une idée de ce qui peut arriver avec la distribution bivariée et les marges normales.

Les marges gaussiennes avec une t-copule peuvent être expérimentées, sans se soucier beaucoup des détails des copules (générer à partir de t bivarié corrélé, ce qui est facile, puis transformer en marges uniformes via la transformation intégrale de probabilité, puis transformer des marges uniformes en gaussiennes via le cdf normal inverse). Il aura une somme non normale mais symétrique. Donc, même si vous n'avez pas de bons packages de copules, vous pouvez toujours faire certaines choses assez facilement (par exemple, si j'essayais de montrer un exemple rapidement dans Excel, je commencerais probablement par la t-copule).

-

Exemple 3 : (cela ressemble plus à ce que j'aurais dû commencer au départ)

Considérons une copule basée sur un uniforme standard , et laissant pour et pour . Le résultat présente des marges uniformes pour et , mais la distribution bivariée est dégénérée. En transformant les deux marges en , nous obtenons une distribution pour qui ressemble à ceci:UV=U0U<12V=32U12U1UVX=Φ1(U),Y=Φ1(V)X+Y

entrez la description de l'image ici

Dans ce cas, la corrélation entre eux est d'environ 0,66.

Encore une fois, et sont des normales corrélées avec une somme (dans ce cas, distinctement) non normale - car elles ne sont pas normales bivariées.XY

[On pourrait générer une gamme de corrélations en inversant le centre de (dans , pour dans ), pour obtenir . Ceux-ci auraient un pic à 0 puis un écart de chaque côté, avec des queues normales.]( 1Uc[0,1(12c,12+c)cV[0,12]V


Du code:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

Le deuxième exemple:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Code pour le troisième exemple:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)
Glen_b -Reinstate Monica
la source
Merci - mais si je ne me trompe pas, est également normal. (Lorsque , nous obtenons , et lorsque , nous obtenons . Donc, avec la probabilité 1, nous obtenons la somme de deux normales standard indépendantes, ce qui est normal.) Je suis après un cas où la somme de deux normales corrélées n'est pas normal, plutôt qu'un cas où la distribution conjointe n'est pas normale. I = 0 U + V I = 1 2 ZX+Y=2IZ+(1I)U+(1I)VI=0U+VI=12Z
mww
Tout à fait raison - à travers mes diverses tentatives pour faire un exemple non bivarié-normal où je pouvais choisir la corrélation, quelque part le long de la ligne, j'ai arrêté de vérifier que la somme n'était pas normale. Je vais remplacer l'exemple par quelque chose où je démontre une somme non normale, mais il n'aura pas la possibilité de sélectionner directement . Attendez, cela peut prendre environ une heure avant que je puisse y arriver. ρ
Glen_b -Reinstate Monica
J'ai remplacé l'exemple par deux exemples spécifiques utilisant des copules de Clayton
Glen_b -Reinstate Monica
Fabuleux - merci! Un merci spécial pour le code R.
mww
J'ai ajouté un troisième exemple et à la fin de celui-ci, je décris un moyen d'obtenir quelque chose comme ce que j'essayais à l'origine - un moyen d'obtenir une corrélation réglable entre -1 et 1 (à part des cas spéciaux aux extrémités), mais pour lesquels la somme n'est pas normale.
Glen_b -Reinstate Monica
-1

J'ai trouvé un exemple. X est une variable normale standard et Y = -X. Alors X + Y = 0, qui est constant. Quelqu'un peut-il confirmer qu'il s'agit d'un contre-exemple?

Nous savons que si X, Y sont conjointement normaux, leur somme est également normale. Mais que faire si leur corrélation est de -1 ??

Je suis un peu confus à ce sujet. THX.

Zirui Zhang
la source
Vous obtenez la même chose est vraie lorsque X = Y puis XY = 0. Ce sont des distributions normales qui ne sont pas normales bivariées. Par conséquent, la propriété selon laquelle les combinaisons linéaires de sont normales qui s'appliquent à la normale bivariée n'a pas besoin d'être appliquée.
Michael R. Chernick
@Zirui IMO est un cas dégénéré de la normale ( ) plutôt qu'un contre-exemple direct, bien que cela dépende de vos définitions. σ0
Glen_b -Reinstate Monica