Différence entre la distribution normale standard multivariée et la copule gaussienne

17

Je me demande quelle est la différence entre la distribution normale standard multivariée et la copule gaussienne, car lorsque je regarde la fonction de densité, elles me semblent les mêmes.

Mon problème est de savoir pourquoi la copule gaussienne est introduite ou quel avantage la copule gaussienne génère ou quelle est sa supériorité lorsque la copule gaussienne n'est rien d'autre qu'une fonction normale standard multivariée elle-même.

Quel est également le concept derrière la transformation intégrale des probabilités dans la copule? Je veux dire que nous savons qu'une copule est une fonction à variable uniforme. Pourquoi doit-il être uniforme? Pourquoi ne pas utiliser les données réelles comme la distribution normale multivariée et trouver la matrice de corrélation? (Normalement, nous traçons les deux rendements des actifs pour prendre en compte leurs relations, mais lorsqu'il s'agit de copules, nous traçons les Us qui sont des probabilités à la place.)

Une autre question. Je doute également que la matrice de corrélation de MVN puisse être non paramétrique ou semi-paramétrique comme celles de copule (car le paramètre de copule peut être le tau de Kendall, etc.)

Je serais très reconnaissant de votre aide car je suis nouveau dans ce domaine. (mais j'ai lu beaucoup d'articles et ce sont les seules choses que je ne comprends pas)

user26979
la source
Comment "regardez-vous la fonction de densité"? Vous n'utilisez peut-être pas une méthode suffisamment sensible. Par exemple, la densité n'est assurément pas multivariée normale lorsque les marginaux ne sont pas normaux! Essayez ceci à l' aide d' une copule gaussienne avec un multimodal de distribution, comme une version bêta : qui devrait regarder résolument non-normal! (1/2,1/2)
whuber
l'équation (6) est une copule gaussienne bivariée CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/… tandis que la première section de l'équation de description est bivariée standard normale CDF roguewave.com/portals/0/products/ imsl-numerical-bibliothèques /… et lorsque nous les comparons ensemble, la forme fonctionnelle est très similaire. eh bien ils sont exactement les mêmes pour moi.
user26979
Vous avez raison: c'est pourquoi vous ne devez pas vous fier à des références Internet aléatoires, en particulier à celles dont les termes sont mal définis et la composition horrible. Consultez Nelson (l'une des sources de votre premier lien, et parfaitement lisible).
whuber
1
alors, si vous ne mentionnez pas le site ci-dessus, quelle est la différence selon vous?
user26979

Réponses:

20

Une règle générale concernant les articles techniques - en particulier ceux trouvés sur le Web - est que la fiabilité de toute définition statistique ou mathématique qui y est proposée varie inversement avec le nombre de sujets non statistiques non apparentés mentionnés dans le titre de l'article. Le titre de la page dans la première référence proposée (dans un commentaire à la question) est «De la finance à la cosmologie: la copule de la structure à grande échelle». Avec à la fois la «finance» et la «cosmologie» en bonne place, nous pouvons être sûrs que ce n'est pas une bonne source d'informations sur les copules!

Passons plutôt à un manuel standard et très accessible, Une introduction aux copules de Roger Nelsen (deuxième édition, 2006), pour les définitions clés.

... chaque copule est une fonction de distribution conjointe avec des marges uniformes sur [l'intervalle unitaire fermé .[0,1]]

[À la p. 23, en bas.]

Pour avoir un aperçu des copules, tournez-vous vers le premier théorème du livre, le théorème de Sklar :

Soit une fonction de distribution conjointe avec des marges F et G . Il existe alors une copule C telle que pour tout x , y dans [les nombres réels étendus], H ( x , y ) = C ( F ( x ) , G ( y ) ) .HFgCX,y

H(X,y)=C(F(X),g(y)).

[Déclaré aux pp. 18 et 21.]

Bien que Nelsen ne l'appelle pas en tant que tel, il définit la copule gaussienne dans un exemple:

... si désigne la fonction de distribution normale standard (univariée) et N ρ désigne la fonction de distribution normale bivariée standard (avec le coefficient de corrélation produit-moment de Pearson ρ ), alors ... C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

C(u,v)(Φ1(u),Φ1(v))FGCΦFGC

(Φ1(F(x)),Φ1(G(y)))FG


Exemple

F(4,2)Xg(2)OuiHFgXy

Terrain

0X10y

Le manque de symétrie le rend évidemment non normal (et sans marges normales), mais il a néanmoins une copule gaussienne par construction. FWIW il a une formule et c'est moche, aussi évidemment pas bivarié Normal:

132(20(1-X)X3)(e-yy)exp(w(X,y))

w(X,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx

whuber
la source
Merci pour la modification, @Cardinal: Je suis gêné de mal orthographier le nom de Nelsen, surtout quand je le regardais directement au début du livre! (Pour ma défense, je l'avais remarqué pour la première fois dans la bibliographie du document de référence du PO, où il est également mal orthographié: cela a dû rester avec moi. :-)
whuber
C'était une chose si mineure, j'ai pensé que j'allais juste continuer et faire les modifications. L'orthographe est inhabituelle (au moins en anglais!), Surtout par rapport à la variante la plus courante. :-)
Cardinal