Trois points sur la régression Poisson vs Normal, tous concernant la spécification du modèle:
Effet des changements de prédicteurs
Avec un prédicteur continu comme le score du test de mathématiques, la régression de Poisson (avec le lien de log habituel) implique qu'un changement d'unité dans le prédicteur entraîne un changement en pourcentage du nombre de récompenses, c'est-à-dire que 10 points supplémentaires sur le test de mathématiques sont associés, par exemple, 25 pour cent plus de récompenses. Cela dépend du nombre de bourses que l'étudiant devrait déjà recevoir. En revanche, la régression normale associe 10 points supplémentaires à un montant fixe, disons 3 récompenses supplémentaires en toutes circonstances. Vous devriez être satisfait de cette hypothèse avant d'utiliser le modèle qui le fait. (fwiw je pense que c'est très raisonnable, modulo le point suivant.)
Traiter avec des étudiants sans prix
À moins qu'il n'y ait vraiment de nombreuses bourses réparties sur de nombreux étudiants, le nombre de bourses sera plutôt faible. En fait, je prédis une inflation zéro, c'est-à-dire que la plupart des étudiants n'obtiennent aucun prix, donc beaucoup de zéros, et certains bons étudiants reçoivent pas mal de prix. Cela dérange les hypothèses du modèle de Poisson et est au moins aussi mauvais pour le modèle normal.
Si vous avez une quantité décente de données, un modèle «gonflé à zéro» ou «obstacle» serait alors naturel. Il s'agit de deux modèles liés: un pour prédire si l'étudiant obtient des bourses, et un autre pour prédire combien elle recevra si elle en obtient (en général une forme de modèle de Poisson). Je m'attendrais à ce que toute l'action soit dans le premier modèle.
Exclusivité du prix
Enfin, un petit point sur les récompenses. Si les prix sont exclusifs, c'est-à-dire si un étudiant obtient le prix, aucun autre étudiant ne peut obtenir le prix, alors vos résultats sont couplés; un décompte pour l'élève a réduit le décompte possible de tous les autres. La pertinence de cette question dépend de la structure des bourses et de la taille de la population étudiante. Je l'ignorerais au premier passage.
En conclusion, Poisson domine confortablement Normal, sauf pour les très grands nombres, mais vérifiez les hypothèses du Poisson avant de vous y appuyer fortement pour l'inférence, et soyez prêt à passer à une classe de modèle légèrement plus complexe si nécessaire.