J'essaie de comprendre la logique derrière le test du chi carré.
Le test du carré est . est ensuite comparé à une distribution Chi-carré pour trouver une valeur p afin de rejeter ou non l'hypothèse nulle. : les observations proviennent de la distribution que nous avons utilisée pour créer nos valeurs attendues. Par exemple, nous pourrions tester si la probabilité d'obtention est donnée par comme nous l'espérons. Nous donc 100 fois et trouvons et . Nous voulons comparer notre résultat à ce qui est attendu ( ). On pourrait aussi bien utiliser une distribution binomiale mais ce n'est pas l'objet de la question… La question est: χ2H0pnH1-nH100⋅phead
Heads
tails
Pouvez-vous expliquer pourquoi, dans l'hypothèse nulle, suit une distribution chi carré?
Tout ce que je sais de la distribution du chi carré, c'est que la distribution du chi carré du degré est la somme de la distribution normale standard du carré.k
Réponses:
Néanmoins, c'est notre point de départ même pour votre question réelle. Je vais le couvrir de manière quelque peu informelle.
Considérons plus généralement le cas binomial:
Supposons que et sont tels que est bien approximé par une normale avec la même moyenne et la même variance (certaines exigences typiques sont que n'est pas petite, ou que n'est pas petit).n p Y min(np,n(1−p)) np(1−p)
Alors sera approximativement . Ici est le nombre de succès.(Y−E(Y))2/Var(Y) ∼χ21 Y
Nous avons et .E(Y)=np Var(Y)=np(1−p)
(Dans le cas de test, est connu et est spécifié sous . Nous ne faisons aucune estimation.)n p H0
Donc sera approximativement .(Y−np)2/np(1−p) ∼χ21
Notez que . Notez également que .(Y−np)2=[(n−Y)−n(1−p)]2 1p+11−p=1p(1−p)
D'où(Y−np)2np(1−p)=(Y−np)2np+(Y−np)2n(1−p)=(Y−np)2np+[(n−Y)−n(1−p)]2n(1−p)=(OS−ES)2ES+(OF−EF)2EF
Ce qui est juste la statistique du chi carré pour le cas binomial.
Ainsi, dans ce cas, la statistique du khi carré devrait avoir la distribution du carré d'une variable aléatoire (approximativement) standard-normale.
la source