Suffisance ou insuffisance

10

Considérons un échantillon aléatoire où sont iid des variables aléatoires de où . Vérifiez si est une statistique suffisante pour .{X1,X2,X3}XiBernoulli(p)p(0,1)T(X)=X1+2X2+X3p

Premièrement, comment trouver la distribution de ? Ou devrait-il être décomposé en et cela suivra-t-il ? Je ne pense pas car notez que toutes les variables ne sont pas indépendantes ici.(X1+2X2+X3)X1+X2+X2+X3Bin(4,p)

Alternativement, si j'emploie la condition de factorisation en considérant simplement l'articulation pmf de alors où .(X1,X2,X3)f(X1,X2,X3)=px1+x2+x3(1p)3(x1+x2+x3)=[pt(x)(1p)3t(x)]px2(1p)x2t(x)=x1+2x2+x3

Cela montre que n'est pas suffisant.T

Mais que faire si je veux suivre la définition et appliquer pour vérifier si ce rapport est indépendant de ? Ensuite, j'ai besoin de connaître la distribution de . Quelle est donc la distribution de ?f(X|p)g(T(X)|p)pgT(X)=X1+2X2+X3

Landon Carter
la source
1
Astuce: vous n'avez pas besoin de connaître la distribution complète de . Considérons, par exemple, le cas : quelle est la distribution de probabilité conditionnelle de ? T(X)T(X)=2(X|T(X)=2)
whuber
Si alors . Donc qui dépend de , correct? T(X)=2(X1,X2,X3){(1,0,1),(0,1,0)}P(X|T(X)=2)=p2(1p)+p(1p)2=p(1p)p
Landon Carter
1
C'est la bonne idée - mais je ne vois pas pourquoi vous ajoutez les deux probabilités. n'est-il pas un vecteur ? (Si vous le souhaitez, vous pouvez utiliser le même type de calculs pour trouver la distribution complète de (il ne peut atteindre que les valeurs ), mais ce n'est plus nécessaire, n'est-ce pas? ))XT(X)0,1,2,3,4
whuber
Oui en effet. Merci! Donc, une fois que nous montrons que ce rapport n'est pas indépendant de pour au moins une fois l'échantillon, alors nous avons terminé! Je vous remercie. Et BONNE ANNÉE :)p
Landon Carter
Oui est un vecteur, mais plus important encore et la probabilité . S'il vous plait corrigez moi si je me trompe. XX=(X1,X2,X3)P(X|T(X)=2)=P(T(X)=2)=P(X=(1,0,1))+P(X=(0,1,0))
Landon Carter

Réponses:

11

J'ai eu une discussion avec "whuber" et j'ai peut-être eu un indice (correct?) Pour examiner n'importe quel point d'échantillon: évaluer à ce point d'échantillonnage et vérifier si ce rapport est indépendant du paramètre, dans ce cas .P(X=x)P(T(X)=T(x))xp

Prenez donc puis . Nous évaluons donc Maintenant,En raison de la propriété iid,Aussix=(1,0,1)T(1,0,1)=2P(X=(1,0,1))P(T(X)=2)

T(X)=2 iff X{(1,0,1),(0,1,0)}.
P(X=(1,0,1))=p2(1p) and P(X=(0,1,0))=p(1p)2.
P(T(X)=2)=P(X=(1,0,1))+P(X=(0,1,0))=p(1p).

D'où qui dépend clairement de , et donc n'est pas une statistique suffisante.

P(X=(1,0,1))P(T(X)=2)=p2(1p)p(1p)=p
pT
Landon Carter
la source