Supposons qu'un surveillant soupçonne un élève de copier les réponses sur le papier d'un autre élève lors d'un examen à choix multiples. Elle vérifie plus tard leurs réponses et trouve des similitudes, mais d'un autre côté, il y a forcément des similitudes étant donné la nature de l'examen. Comment doit-elle procéder pour déterminer si ses soupçons sont fondés?
En d'autres termes, elle devra sûrement comparer les examens à ceux des autres étudiants (qui, supposons-le, ne trichaient pas). Mais si la taille des classes est très grande, est-il raisonnable de prendre un échantillonnage aléatoire pour comparaison? Combien en prendrait-elle alors? S'il y avait beaucoup de questions à l'examen, serait-il également raisonnable de prendre un échantillon des questions pour comparaison? Cela fait-il une différence significative si chaque question avait 2 réponses possibles (vrai / faux) ou, disons, 4?
Je n'ai pas de chiffres précis parce que je me demande comment cela fonctionnerait en général. J'ai une formation en mathématiques mais peu de formation en statistique. Comment décririez-vous cette analyse en termes statistiques?
Je vous remercie.
la source
Réponses:
Voici un tableau étonnamment vaste des index de copie des réponses, avec peu de discussion sur leurs mérites: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Il existe un domaine de la psychologie (éducative) appelé théorie de la réponse aux items (IRT) qui fournit le contexte statistique pour des questions comme celles-ci. Si vous êtes un Américain et avez passé un SAT, ACT ou GRE, vous avez traité un test développé en pensant à l'IRT. Le postulat de base de l'IRT est que chaque étudiant est caractérisé par sa capacité ; chaque question est caractérisée par sa difficulté ; et la probabilité de répondre correctement à une question est où est le cdf de la normale standard, etje uneje bj
Pour les questions "Oui / Non", cela peut être la fin de l'histoire. Pour plus de deux catégories de questions, nous pouvons faire l'hypothèse supplémentaire que tous les mauvais choix sont également probables; pour une question avec choix, la probabilité de chaque mauvais choix est .j kj π′(uneje,bj; c ) = [ 1 - π(uneje,bj; c ) ] / (kj- 1 )
Pour les étudiants de capacitésuneje et unek , la probabilité qu'ils correspondent à leurs réponses pour une question avec difficulté bj est
Maintenant, vous pouvez calculer la probabilité d'appariement, mais elle sera probablement minuscule combinatoire. Une meilleure mesure peut être le rapport des informations dans le modèle de réponses par paire,
Les paramètres du test{ c ,bj, j = 1 , 2 , … } et les capacités des élèves {uneje} ne tombera pas du ciel bleu, mais ils sont facilement estimables dans les logiciels modernes tels que R avec
lme4
ou des packages similaires:ou quelque chose de très proche de cela.
la source