J'analyse actuellement les données d'une série d'expériences comportementales qui utilisent toutes la mesure suivante. Les participants à cette expérience sont invités à sélectionner des indices que d'autres personnes (fictives) pourraient utiliser pour résoudre une série de 10 anagrammes. Les participants sont amenés à croire que ces autres personnes gagneront ou perdront de l'argent, selon leur performance dans la résolution des anagrammes. Les indices varient quant à leur utilité. Par exemple, pour l'anagramme NUNGRIN, une anagramme de RUNNING, trois indices pourraient être:
- Se déplacer rapidement (inutile)
- Ce que vous faites dans une course de marathon (utile)
- Pas toujours un passe-temps sain (inutile)
Pour former la mesure, je compte le nombre de fois (sur 10) qu'un participant choisit un indice inutile pour l'autre personne. Dans les expériences, j'utilise une variété de manipulations différentes pour affecter l'utilité des indices que les gens sélectionnent.
Étant donné que la mesure de l'utilité / de l'inutilité est assez fortement biaisée positivement (une grande proportion de personnes choisissent toujours les 10 indices les plus utiles), et parce que la mesure est une variable de comptage, j'ai utilisé un modèle linéaire généralisé de Poisson pour analyser ces données. Cependant, quand j'ai fait un peu plus de lecture sur la régression de Poisson, j'ai découvert que parce que la régression de Poisson n'évalue pas indépendamment la moyenne et la variance d'une distribution, elle sous-estime souvent la variance dans un ensemble de données. J'ai commencé à rechercher des alternatives à la régression de Poisson, telles que la régression quasipoisson ou la régression binomiale négative. Cependant, j'avoue que je suis plutôt nouveau dans ce genre de modèles, alors je viens ici pour des conseils.
Quelqu'un a-t-il des recommandations sur le modèle à utiliser pour ce type de données? Y a-t-il d'autres considérations dont je devrais être conscient (par exemple, un modèle particulier est-il plus puissant qu'un autre?)? Quel type de diagnostic dois-je examiner pour déterminer si le modèle que je sélectionne gère correctement mes données?
la source
Réponses:
Votre résultat est le nombre d'indices utiles sur 10, qui est une variable aléatoire binomiale. Vous devez donc l'analyser avec une sorte de régression binomiale, probablement quasi-binomiale pour permettre une surdispersion. Notez que le Poisson et les distributions binomiales négativement nommées de manière trompeuse conviennent aux données de comptage non bornées.
la source
betabin
dans leaod
package le fera.Je recommanderais moi aussi de regarder le binôme négatif si les résultats possibles étaient infinis comme pour le Poisson. Vous voudrez peut-être consulter l'un des livres de Joe Hilbe. Il en a un sur GEE et un sur la régression binomiale négative qu'il contraste avec la régression de Poisson. Mais comme l'a souligné Aniko, il n'y a que 10 indices, donc chaque répondant ne peut avoir que 0, 1, 2, 3, ..., 10 et donc ni Poisson ni exponentielle négative ne sont appropriés.
la source
Bon point par @Aniko. Un autre choix est la régression bêta. Il y avait un article intitulé "A Better Lemon Squeezer" qui donnait beaucoup d'informations sur cette méthode.
la source