Limites de l'espérance conditionnelle avec marges normales et corrélation spécifiée (Pearson)

8

J'ai vu la question suivante sur un autre forum:

"Supposons que la taille et le poids des hommes adultes puissent être décrits avec des modèles normaux et que la corrélation entre ces variables soit de 0,65. Si la taille d'un homme le place au 60e centile, à quel centile vous attendriez-vous à ce que son poids soit?"

Je vois que quelqu'un au forum en question a déjà souligné que la question parle de marges normales ( height and weight ... can be described with normal models), pas de normalité bivariée et donc la question n'a pas de réponse unique.

De toute évidence, la réponse dépendrait de la relation de dépendance bivariée réelle (la copule), ce qui m'a rendu curieux.

Ma question est:

Compte tenu des marges normales et d'une corrélation de population spécifiée ( , une corrélation de Pearson), existe-t-il un moyen raisonnablement simple de trouver des limites sur étant donné tous deux normaux, avec corrélation ?ρE(Y|X=xq)X,Yρ

S'il y a une valeur exacte la plus grande et la plus petite valeur pour l'attente conditionnelle, cela (et de préférence, les circonstances dans lesquelles chacun se produit *) serait bien connu.

* J'ai de fortes suspicions sur ce que pourraient être ces circonstances (c'est-à-dire le type de dépendance qui pourrait être impliqué; en particulier, je m'attends à ce qu'un type spécifique de distribution dégénérée donne les limites) mais je n'ai pas encore étudié cette pensée dans aucune profondeur. (Je suppose que quelqu'un est déjà susceptible de le savoir.)

À défaut, des limites supérieures ou inférieures sur les valeurs les plus grandes et les plus petites seraient intéressantes.

Je n'ai pas nécessairement besoin d'une réponse algébrique (un algorithme le ferait), bien qu'une réponse algébrique serait bien.

Des réponses approximatives ou partielles peuvent être utiles / utiles.

Si personne n'a de bonnes réponses, je peux essayer moi-même.

Glen_b -Reinstate Monica
la source

Réponses:

4

Je pense qu'il n'y a pas de limites. Cette conclusion repose sur la construction suivante, qui est la plus simple à décrire pour les distributions continues arbitraires. Au fur et à mesure, des conditions seront ajoutées jusqu'à ce que nous soyons dans le cas des marginaux normaux.

Alors, laissez soit une variable aléatoire continue avec la fonction de distribution . Étant donné tout intervalle semi-ouvert (qui deviendra finalement très étroit), définissezXF(a,b]

ψ:(a,b](,c]

via

ψ(x)=F1(F(x)F(a)).

Ceci augmente de façon monotone et évidemment . Par construction,c=ψ(b)=F1(F(b)F(a))

Pr(X(a,b])=Pr(ψ(X)c).

Étendez à une carte un à un viaψΨ:RR

Ψ|(a,b]=ψ,Ψ|(,c]=ψ1

et sinon . La distribution de est identique à celle de , mais ce qu'elle a fait est d'échanger les valeurs entre les deux intervalles et .Ψ(x)=xΨ(X)X(a,b](,c]

Figure 1: graphique de Psi

Exemple de pour .Ψ(a,b]=(1.5,1.75]

Laissez la corrélation de Pearson de est . (Sans perte de généralité, nous pouvons maintenant supposer que et ont été standardisés, car cela ne changera ni ni la continuité de ). Soit n'importe quel nombre réel, comme dans la question, où l'espérance conditionnelle de doit être évaluée. Choisissez pour lequel mais rendez-le si étroit que est minuscule. Ensuite, le changement de à(X,Y)ρ(1,1)XYρXxqY(a,b]xq(a,b]Pr(X(a,b])ρ=E(XY)ρ=E(Ψ(X)Y)peut être rendue arbitrairement petite. (Il faut un peu de travail pour le montrer; cela revient au fait que l'espérance conditionnelle de étant donné augmente relativement lentement à mesure que diminue. Sinon, ne serait pas défini.) Cependant, appliquer changes àYXc|ba|ρΨE(Y|X=xq)

E(Y|Ψ(X)=xq)=E(Y|X=Ψ(xq)),

qui est une attente conditionnelle pour à une valeur de inférieure ou égale à .YXc

Figure 2: graphique du PDF de (Psi (X), Y)

Contours du PDF. Ici . La distribution normale bivariée d'origine a reçu une corrélation de , qui a été réduite à environ - la valeur cible - lorsque les probabilités dans les deux bandes ont été échangées.(a,b]=(1.5,1.75]0.850.5

Lorsque est une distribution normale bivariée, as . À condition que , l'attente conditionnelle de soit repoussée à pour et à pour . Une construction analogue, permutant l'intervalle avec , poussera l' infini conditionnel de infiniment loin dans l'autre sens. En ajustant légèrement la valeur d'origine de nous pouvons compenser la variation infinitésimale de(X,Y)c|ba|0ρ0Yρ>0+ρ<0(a,b][c,)Yρρcela se produit, montrant que quelle que soit la valeur d'origine de , nous ne pouvons rien dire sur l'espérance conditionnelle de à un point particulier .ρYX=xq

(L'exception apparente peut être gérée en commençant par, disons, une distribution bivariée avec des marginaux normaux dont le support est limité aux lignes .)ρ=0y=±x

whuber
la source
+1 C'est très intéressant. C'est quelque peu lié à la construction que j'avais en tête en écrivant la question, mais c'est mieux ciblé pour déplacer juste le conditionnel dans le voisinage immédiat du quantile et une discussion plus réfléchie que je ne l'avais joué avec. Votre conclusion semble correcte en première lecture. Je vous remercie.
Glen_b -Reinstate Monica
En fait, +1 est insuffisant ici.
Glen_b -Reinstate Monica
0

Si je comprends bien votre question, la réponse dépend de la "relation de dépendance bivariée réelle (la copule)" utilisée.

Eh bien, il existe des limites sur la valeur qu'une copule peut prendre, n'est-ce pas? Alors pourquoi ne pas utiliser la copule de comonotonicité et la copule de contre-monotonie pour établir les limites.

entrez la description de l'image ici

Source: Thorsten Schmidt - Faire face aux copules

Henry E
la source
La question est plus restrictive que les bornes des copules - vous ne pouvez pas atteindre les bornes de co- et contre-monotonie à cause de la contrainte sur . ρ
Glen_b -Reinstate Monica