Si

14

Question

Si sont IID, alors calculez , où . $X_1,\cdots,X_n \sim \mathcal{N}(\mu, 1)$ $\mathbb{E}\left( X_1 \mid T \right)$ $T = \sum_i X_i$

Tentative : veuillez vérifier si les informations ci-dessous sont correctes.

Disons que nous prenons la somme de ces attentes conditionnelles telles que Cela signifie que chaque puisque sont IID.

\begin{aligned} \sum_{i} E (X_{i} ∣ T) = E (\sum_{i} X_{i} ∣ T) = T . \end{aligned}

$\begin{align} \sum_i \mathbb{E}\left( X_i \mid T \right) = \mathbb{E}\left( \sum_i X_i \mid T \right) = T . \end{align}$

E (X_{i} ∣ T) = \frac{T}{n}

$\mathbb{E}\left( X_i \mid T \right) = \frac{T}{n}$

X_{1}, \dots, X_{n}

$X_1,\ldots,X_n$

Ainsi, . Est-ce correct? $\mathbb{E}\left( X_1 \mid T \right) = \frac{T}{n}$

probability self-study mathematical-statistics conditional-probability conditional-expectation apprentissage
la source

2

Les ne sont pas iid conditionnels à mais ont une distribution conjointe échangeable. C'est ce qui implique que leurs attentes conditionnelles sont toutes égales (à ).

X_{i}

$X_i$

T

$T$

T / n

$T/n$

Jarle Tufto

@JarleTufto: Qu'entendez-vous par "distribution conjointe échangeable"? Distribution conjointe de et ?

X_{i}

$X_i$

T

$T$

apprentissage

2

Cela signifie que la distribution conjointe de est la même que celle de (et toutes les autres permutations). Voir en.wikipedia.org/wiki/Exchangeable_random_variables . Ou voyez la réponse de @ whuber!

X_{1}, X_{2}, X_{3}

$X_1,X_2,X_3$

X_{2}, X_{3}, X_{1}

$X_2,X_3,X_1$

Jarle Tufto

2

Notamment, la réponse est indépendante de la distribution de .

X_{1}, \dots, X_{n}

$X_1,\ldots,X_n$

StubbornAtom

11

L'idée a raison - mais il s'agit de l'exprimer un peu plus rigoureusement. Je vais donc me concentrer sur la notation et exposer l'essence de l'idée.

Commençons par l'idée d' échangeabilité:

Une variable aléatoire est échangeable lorsque les distributions des variables permutées sont tous identiques pour chaque permutation possible . $\mathbf X=(X_1, X_2, \ldots, X_n)$ $\mathbf{X}^\sigma=(X_{\sigma(1)}, X_{\sigma(2)}, \ldots, X_{\sigma(n)})$ $\sigma$

Clairement, iid implique échangeable.

En de notation, écrivez pour le composant de et laissez $X^\sigma_i = X_{\sigma(i)}$ $i^\text{th}$ $\mathbf{X}^\sigma$

T^{σ} = \sum_{i = 1}^{n} X_{i}^{σ} = \sum_{i = 1}^{n} X_{i} = T .

$T^\sigma = \sum_{i=1}^n X^\sigma_i = \sum_{i=1}^n X_i = T.$

Soit tout indice et toute permutation des indices qui envoie à (Un tel existe parce qu'on peut toujours simplement échanger et ) L'échangeabilité de implique $j$ $\sigma$ $1$ $j = \sigma(1).$ $\sigma$ $1$ $j.$ $\mathbf X$

E [X_{1} ∣ T] = E [X_{1}^{σ} ∣ T^{σ}] = E [X_{j} ∣ T],

$E[X_1\mid T] = E[X^\sigma_1\mid T^\sigma] = E[X_j\mid T],$

parce que (dans la première inégalité) nous avons simplement remplacé par le vecteur de distribution identiqueC'est le nœud du problème. $\mathbf X$ $\mathbf X^\sigma.$

par conséquent

T = E [T ∣ T] = E [\sum_{i = 1}^{n} X_{i} ∣ T] = \sum_{i = 1}^{n} E [X_{i} ∣ T] = \sum_{i = 1}^{n} E [X_{1} ∣ T] = n E [X_{1} ∣ T],

$T = E[T \mid T] = E[\sum_{i=1}^n X_i\mid T] = \sum_{i=1}^n E[X_i\mid T] = \sum_{i=1}^n E[X_1\mid T] = n E[X_1 \mid T],$

D'où

E [X_{1} ∣ T] = \frac{1}{n} T .

$E[X_1\mid T] = \frac{1}{n} T.$

whuber
la source

4

$\newcommand{\one}{\mathbf 1}$ Ce n'est pas une preuve (et +1 à la réponse de @ whuber), mais c'est une manière géométrique de construire une intuition sur la raison pour laquelle est un réponse sensée. $E(X_1 | T) = T/n$

Soit et donc . Nous conditionnons ensuite sur l'événement que pour certains , donc c'est comme dessiner des Gaussiens multivariés supportés sur mais en ne regardant que ceux qui se retrouvent dans l'affine espace . Ensuite, nous voulons connaître la moyenne des coordonnées des points qui atterrissent dans cet espace affine (sans parler du fait qu'il s'agit d'un sous-ensemble de mesure zéro). $X = (X_1,\dots,X_n)^T$ $\one = (1,\dots,1)^T$ $T = \one^TX$ $\one^TX = t$ $t \in \mathbb R$ $\mathbb R^n$ $\{x \in \mathbb R^n : \one^Tx = t\}$ $x_1$

Nous connaissons

X \sim N (μ 1, I)

$X \sim \mathcal N(\mu \one, I)$ , nous avons donc une gaussienne sphérique avec un vecteur moyen constant, et le vecteur moyen

μ 1

$\mu\one$ est sur la même ligne que le vecteur normal de l'hyperplan

x^{T} 1 = 0

$x^T\one = 0$ .

Cela nous donne une situation comme l'image ci-dessous:

L'idée clé: imaginez d'abord la densité sur le sous-espace affine $H_t := \{x : x^T\one = t\}$ . La densité de $X$ est symétrique autour de $x_1 = x_2$ puisque $E(X) \in \text{span } \one$ . La densité sera également symétrique sur $H_t$ car $H_t$ est également symétrique sur la même ligne, et le point autour duquel elle est symétrique est l'intersection des lignes $x_1 + x_2 = t$ et $x_1 = x_2$ . Cela se produit pour $x = (t/2, t/2)$ .

Pour imaginer $E(X_1 | T)$ nous pouvons imaginer échantillonner encore et encore, puis chaque fois que nous obtenons un point dans $H_t$ nous prenons juste la coordonnée $x_1$ et l'enregistrons. À partir de la symétrie de la densité sur $H_t$ la distribution des coordonnées $x_1$ sera également symétrique, et elle aura le même point central de $t/2$ . La moyenne d'une distribution symétrique est le point central de symétrie donc cela signifie $E(X_1 | T) = T/2$ , et que $E(X_1| T) = E(X_2 | T)$ puisque $X_1$ et $X_2$ peuvent être échangés sans rien affecter.

Dans des dimensions plus élevées, cela devient difficile (ou impossible) à visualiser exactement, mais la même idée s'applique: nous avons un gaussien sphérique avec une moyenne dans l'intervalle de $\one$ , et nous examinons un sous-espace affine qui est perpendiculaire à cela. Le point d'équilibre de la distribution sur le sous-espace sera toujours l'intersection de la $\text{span }\one$ et $\{x : x^T\one = t\}$ qui est à $x=(t/n, \dots, t/n)$ , et la densité est toujours symétrique donc ce point d'équilibre est à nouveau la moyenne.

Encore une fois, ce n'est pas une preuve, mais je pense que cela donne une idée décente de la raison pour laquelle vous vous attendez à ce comportement en premier lieu.

Au-delà de cela, comme certains l'ont noté @StubbornAtom, cela ne nécessite pas réellement que $X$ soit gaussien. En 2D, notez que si $X$ est échangeable, alors $f(x_1, x_2) = f(x_2, x_1)$ (plus généralement, $f(x) = f(x^\sigma)$ ) donc $f$ doit être symétrique sur la ligne $x_1 = x_2$ . Nous avons également $E(X) \in \text{span }\one$ donc tout ce que j'ai dit concernant "l'idée clé" dans la première image est toujours valable. Voici un exemple où les $X_i$ sont iid à partir d'un modèle de mélange gaussien. Toutes les lignes ont la même signification que précédemment.

jld
la source

1

Je pense que votre réponse est juste, bien que je ne sois pas tout à fait sûr de la ligne de tueur dans votre preuve, qu'elle soit vraie "parce qu'ils sont iid". Un moyen plus détaillé de la même solution est le suivant:

Réfléchissez à ce que signifie $\mathbb{E}(x_{i}|T)$ . Vous savez que vous avez un échantillon avec N lectures et que leur moyenne est T. échantillonné à partir d'un gaussien dans votre preuve).

$\mathbb{E}(x_{i}|T)$ est la réponse à la question, si vous avez échantillonné à partir de votre échantillon, avec remplacement plusieurs fois, quelle serait la moyenne que vous avez obtenue. C'est la somme de toutes les valeurs possibles, multipliée par leur probabilité, ou $\sum_{i=1}^{N}\frac{1}{N}x_{i}$ qui est égal à T.

gazza89
la source

1

Notez que le

ne peut pas être IID, car ils sont contraints de totaliser

. Si vous connaissez

d'entre eux, vous connaissez aussi le

.

x_{i} | T

$x_i|T$

T

$T$

n - 1

$n-1$

n^{t h}

$n^{th}$

jbowman

oui, mais j'ai fait quelque chose de plus subtil, j'ai dit que si vous échantillonniez plusieurs fois avec remplacement, chaque échantillon serait un échantillon iid d'une distribution discrète.

gazza89

Pardon! Égaré le commentaire, il aurait dû être au PO. Il était fait référence à la déclaration "Cela signifie que chaque

depuis

sont IID. "

E (X_{i} ∣ T) = \frac{T}{n}

$\mathbb{E}\left( X_i \mid T \right) = \frac{T}{n}$

X_{1}, \dots, X_{n}

$X_1,\ldots,X_n$

jbowman

Si

Réponses: