Voici une simple question de statistiques qui m'a été posée. Je ne suis pas vraiment sûr de le comprendre.
X = le nombre de points acquis dans un examen (choix multiple et une bonne réponse est un point). Le binôme X est-il distribué?
La réponse du professeur a été:
Oui, car il n'y a que des bonnes ou des mauvaises réponses.
Ma réponse:
Non, car chaque question a une "probabilité de réussite" différente p. Comme je l'ai compris, une distribution binomiale n'est qu'une série d'expériences de Bernoulli, qui ont chacune un résultat simple (succès ou échec) avec une probabilité de réussite donnée p (et toutes sont "identiques" en ce qui concerne p). Par exemple, en retournant une pièce (juste) 100 fois, cela fait 100 expériences de Bernoulli et toutes ont p = 0,5. Mais ici, les questions ont différents types de p non?
la source
Réponses:
où peut être considéré comme la capacité des -ièmes personnes et comme la difficulté des questions. Ainsi, le modèle vous permet de saisir le fait que différentes personnes varient en capacités et les questions varient en difficulté, et c'est le plus simple des modèles IRT.βn n δi i
La réponse de vos professeurs suppose que toutes les questions ont la même probabilité de «succès» et sont indépendantes, car le binôme est une distribution d'une somme de iid essais de Bernoulli. Il ignore les deux types de dépendances décrits ci-dessus.n
Comme remarqué dans les commentaires, si vous avez regardé la distribution des réponses d'une personne particulière (donc vous n'avez pas à vous soucier de la variabilité entre les personnes), ou les réponses de différentes personnes sur le même élément (donc il n'y a pas entre- variabilité des items), alors la distribution serait binomiale de Poisson, c'est-à-dire la distribution de la somme de essais de Bernoulli non iid. La distribution pourrait être approximée avec binôme ou Poisson, mais c'est tout. Sinon, vous faites l'hypothèse iid.n
Même dans l'hypothèse "nulle" de la devinette, cela suppose qu'il n'y a pas de modèle de devinette, donc les gens ne diffèrent pas dans leur façon de deviner et les articles ne diffèrent pas dans la façon dont ils sont devinés - donc la devinette est purement aléatoire.
la source
La réponse à ce problème dépend du cadrage de la question et du moment où les informations sont obtenues. Dans l'ensemble, j'ai tendance à être d'accord avec le professeur, mais je pense que l'explication de sa réponse est médiocre et la question du professeur devrait inclure plus d'informations dès le départ.
Si vous considérez un nombre infini de questions d'examen potentielles et que vous en tirez une au hasard pour la question 1, en tirez une au hasard pour la question 2, etc.
Dans ce cadre, les hypothèses d'une expérience binomiale sont remplies.
Hélas, les problèmes statistiques mal proposés sont très courants dans la pratique, pas seulement aux examens. Je n'hésiterais pas à défendre votre justification auprès de votre professeur.
la source
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Je pense que vous devriez rendre explicite l'hypothèse selon laquelle les questions d'examen sont tirées indépendamment du groupe de questions potentielles. Il serait plus réaliste de les corréler: si la question 1 est facile, il est probable que l'on vous donne un examen facile et que la question 2 sera facile.S'il y a n questions, et je peux répondre correctement à n'importe quelle question avec la probabilité p, et qu'il y a suffisamment de temps pour tenter de répondre à toutes les questions, et j'ai fait 100 de ces tests, alors mes scores seraient normalement distribués avec une moyenne de np.
Mais ce n'est pas moi qui répète le test 100 fois, c'est 100 candidats différents qui font un test, chacun avec sa propre probabilité p. La distribution de ces p sera le facteur primordial. Vous pourriez avoir un test où p = 0,9 si vous avez bien étudié le sujet, p = 0,1 si vous ne l'avez pas fait, avec très peu de personnes entre 0,1 et 0,9. La distribution des points aura des maxima très forts à 0,1 n et 0,9 n et sera loin de la distribution normale.
D'un autre côté, il y a des tests où tout le monde peut répondre à n'importe quelle question, mais prend différentes quantités de temps, donc certains répondront à toutes les n questions, et d'autres répondront moins parce qu'ils manquent de temps. Si nous pouvons supposer que la vitesse des candidats est distribuée normalement, alors les points seront proches de la distribution normale.
Mais de nombreux tests contiendront des questions très difficiles et des questions très faciles, intentionnellement afin que nous puissions faire la distinction entre les meilleurs candidats (qui répondront à toutes les questions jusqu'à un certain degré de difficulté) et les pires candidats (qui ne pourront répondre que très questions simples). Cela modifierait assez fortement la distribution des points.
la source
Par définition, une distribution binomiale est un ensemble de essais de Bernoulli indépendants et identiques . Dans le cas d'un examen à choix multiple, chacune des questions serait l'un des essais de Bernoulli.n n
Le problème se pose ici parce que nous ne pouvons raisonnablement supposer que les questions:n
J'ai vu des questions dans les classes de statistiques qui modélisent les questions d'examen sous forme de binômes, mais elles sont formulées de la manière suivante:
Dans ce scénario, bien sûr, il serait représenté comme une distribution binomiale avec .p=14
la source