Distribution non uniforme des valeurs de p lors de la simulation de tests binomiaux sous l'hypothèse nulle

17

J'ai entendu que dans l'hypothèse nulle, la distribution de la valeur de p devrait être uniforme. Cependant, les simulations du test binomial dans MATLAB renvoient des distributions très différentes de celles uniformes avec une moyenne supérieure à 0,5 (0,518 dans ce cas): entrez la description de l'image ici

coin = [0 1];
success_vec = nan(20000,1);

for i = 1:20000
    success = 0;
    for j = 1:200
        success = success + coin(randperm(2,1));
    end
    success_vec(i) = success;
end

    p_vec = binocdf(success_vec,200,0.5);
    hist(p_vec);

Essayer de changer la façon dont je génère des nombres aléatoires n'a pas aidé. J'apprécierais vraiment toute explication ici.

TanZor
la source
6
n/2+1
Que fait exactement le «test binomial» de Matlab?
whuber
2
Il semble que ce soit le test binomial de l'affiche, binocdfc'est juste le CDF du binôme uk.mathworks.com/help/stats/binocdf.html
conjugateprior

Réponses:

20

pH0

Comme James Stanley le mentionne dans les commentaires, la distribution de la statistique de test est discrète, donc ce résultat ne s'applique pas. Vous pouvez ne pas avoir d'erreurs du tout dans votre code (bien que je n'affiche pas une distribution discrète avec un histogramme, je pencherais pour afficher le cdf ou le pmf, ou mieux, les deux).

F(X)=X

entrez la description de l'image ici

Il est tout à fait possible de calculer cette distribution exactement, plutôt que de simuler - mais j'ai suivi votre exemple et fait une simulation (bien que plus grande que la vôtre).

n

α

Glen_b -Reinstate Monica
la source
Merci Glen et @JamesStanley! J'essaie de comprendre ce que cela signifie exactement que la distribution de la valeur de p n'est pas uniforme, et quelles sont les conséquences en termes de test d'hypothèse - mais pour cela, je suppose que je vais plonger dans wikipedia :)
TanZor
3
α
F(X)X
A.Donda, Glen_b - merci! Tu a été d'une grande aide.
TanZor