Pourquoi les degrés de liberté pour des paires appariées testent-ils le nombre de paires moins 1?

9

Je suis habitué à connaître les "degrés de liberté" comme , où vous avez le modèle linéaire \ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} avec \ mathbf {y } \ in \ mathbb {R} ^ n , \ mathbf {X} \ in M_ {n \ times p} (\ mathbb {R}) la matrice de conception de rang r , \ boldsymbol {\ beta} \ in \ mathbb { R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n avec \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .nr

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

D'après ce que je me souviens des statistiques élémentaires (c'est-à-dire des modèles pré-linéaires avec algèbre linéaire), les degrés de liberté pour les paires appariées t test sont le nombre de différences moins 1 . Cela impliquerait donc que X ait le rang 1, peut-être. Est-ce correct? Sinon, pourquoi n-1 est -iln1 le degré de liberté pour le test t des paires tappariées?

Pour comprendre le contexte, supposons que j'ai un modèle à effets mixtes

yijk=μi+ some random effects+eijk
i=1,2 , j=1,,8 et k=1,2 . Il n'y a rien de spécial à propos de μi que c'est un effet fixe, et eijkiidN(0,σe2) . Je suppose que les effets aléatoires ne sont pas pertinents pour ce problème, car nous ne nous soucions que des effets fixes dans ce cas.

Je voudrais fournir un intervalle de confiance pour μ1μ2 .

J'ai déjà montré que d¯=18dj est un estimateur non biaisé de μ1μ2 , où dj=y¯1jy¯2j , y¯1j=12ky1jk et y¯21 est défini de manière similaire. L'estimation ponctuelle d¯ a été calculée.

J'ai déjà montré que

sd2=j(djd¯)281
est un estimateur non biaisé de la variance de dj , et ainsi,
sd28
est l'erreur standard de d¯ . Cela a été calculé.

Maintenant, la dernière partie consiste à déterminer les degrés de liberté. Pour cette étape, j'essaie généralement de trouver la matrice de conception - qui a évidemment le rang 2 - mais j'ai la solution à ce problème, et elle dit que les degrés de liberté sont .81

Dans le contexte de la recherche du rang d'une matrice de conception, pourquoi les degrés de liberté sont-ils ?81

Modifié pour ajouter: La définition de la statistique de test peut être utile dans cette discussion. Supposons que j'ai un vecteur de paramètres . Dans ce cas, (sauf s'il me manque quelque chose). Nous effectuons essentiellement le test d'hypothèse où . Ensuite, la statistique de test est donnée par qui serait testé par rapport à une distribution centrale avecβ = [ μ 1 μ 2 ] c ' β = 0 c ' = [ 1 - 1 ] t = c ' ββ

β=[μ1μ2]
cβ=0
c=[11]tn-rXσ2=y'(I-PX)y
t=cβ^σ^2c(XX)1c
tnrdegrés de liberté, où est la matrice de conception comme ci-dessus, et où .X PX=X(XX)
σ^2=y(IPX)ynr
PX=X(XX)1X
Clarinettiste
la source

Réponses:

5

Le test paires appariées avec paires n'est en fait qu'un test à un échantillon avec un échantillon de taille . Vous avez différences , et celles-ci sont iid et normalement distribuées. La première colonne après an t n n d 1 ,tntnn[ d 1d n ] = [ ˉ dˉ d ] + [ d 1 - ˉ dd 1 - ˉ d ] n  dfd1,,dn=''1n-10

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1degré de liberté en raison de la contrainte linéaire qui dit que toutes les entrées sont égales; le second a degrés de liberté en raison de la contrainte linéaire qui dit que la somme des entrées est .n10
Michael Hardy
la source
En d'autres termes, la raison pour laquelle nous avons ici degrés de liberté n'a rien à voir avec le modèle linéaire ? n1y=Xβ+ϵ
Clarinettiste
1
Cela a à voir avec ce modèle, où la matrice est une colonne de s et est une matrice dont la seule entrée est la différence entre les deux moyennes de population. X1β1×1
Michael Hardy
2
Ah! Donc, votre vecteur serait ce vecteur de s, correct? Merci beaucoup! Je ne peux pas croire à quel point il a été difficile de trouver une réponse à ce sujet! ydi
Clarinettiste
Oui. C'est le vecteur des différences observées dans les paires appariées. n
Michael Hardy
2

Merci beaucoup à Michael Hardy d' avoir répondu à ma question.

L'idée est la suivante: laissez et . Notre modèle linéaire est alors où est le vecteur de tous ceux et Évidemment a le rang , nous avons donc degrés de liberté .

y=[d1dn]
yβ=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

Comment savons-nous que égal à ? Rappelez-vous que et comme on peut le voir facilement, pour tous . Étant donné notre , il est évident que devrait être . Ceci est dû au fait [ μ 1 - μ 2 ] E [ y ] = X β E [ d jβ[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
so devrait être une matrice avec .β1×1β=[μ1μ2]

Définissez . Alors notre test d'hypothèse est Notre statistique de test est donc Nous avons Après quelques travaux, on peut montrer que On peut également montrer quec=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXest symétrique et idempotent. Donc, et
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
qui a évidemment inverse , donnant ainsi une statistique de test qui serait testée sur une distribution centrale avec degrés de la liberté souhaitée.1/n tn-1
μ^1μ^2sd2/n
tn1
Clarinettiste
la source