J'ai un problème à accepter les avantages d'étiqueter un facteur de modèle comme aléatoire pour plusieurs raisons. Il me semble que dans presque tous les cas, la solution optimale consiste à traiter tous les facteurs comme fixes.
Premièrement, la distinction entre fixe et aléatoire est assez arbitraire. L'explication standard est que, si l'on s'intéresse aux unités expérimentales particulières en soi, alors on devrait utiliser des effets fixes et, si on s'intéresse à la population représentée par les unités expérimentales, on devrait utiliser des effets aléatoires. Cela n'aide pas beaucoup car cela implique que l'on peut alterner entre vues fixes et vues aléatoires même si les données et la conception expérimentale restent les mêmes. De plus, cette définition favorise l'illusion que, si un facteur est étiqueté comme aléatoire, l'inférence tirée du modèle est en quelque sorte plus applicable à la population que dans le cas où le facteur est étiqueté comme fixe. Enfin, Gelman montre que la distinction fixe-aléatoire prête à confusion même au niveau de la définition, car il existe quatre autres définitions de ce que sont les effets fixes et aléatoires.
Deuxièmement, l'estimation des modèles mixtes est assez compliquée. Par opposition à un modèle "purement fixe", il existe plus de plusieurs façons d'obtenir les valeurs de p. Le professeur Bates qui a implémenté l'estimation REML dans le paquet lme4 dans R est même allé jusqu'à refuser de déclarer les valeurs de p .
Troisièmement, le nombre de paramètres implicites introduits par un facteur aléatoire pose un problème flou. L'exemple suivant est mon adaptation de celle de Burnham & Anderson, Model Selection and Multi-Model Inference: A Practical Information-Theoretic Approach . Du point de vue du compromis biais-variance, le rôle des effets aléatoires peut être illustré comme suit. Considérons une ANOVA unidirectionnelle avec traitements et effets de facteur principal, dont sont estimables. Le terme d'erreur a la distribution . Si le nombre d'observations est fixe, le compromis biais-variance se détériorera à mesure que augmentera. Supposons que nous disons que leles effets principaux sont tirés de la distribution . Le modèle correspondant aura une complexité qui se situe quelque part entre la version fixe (surajustée) et le modèle sous-équipé qui contient uniquement l'interception. Le nombre de paramètres effectifs dans le modèle fixe est
Le nombre de paramètres effectifs dans le modèle aléatoire est d'au moins trois: . De plus, le modèle aléatoire a un certain nombre de paramètres «cachés» impliqués par la restriction distributionnelle (normale dans ce cas) imposée aux effets principaux.
En particulier, s'il existe un facteur à deux niveaux, cela n'a pas de sens de l'appeler aléatoire, même si nous savons avec certitude que ses niveaux ont été échantillonnés au hasard dans une certaine population. En effet, la version à effet fixe a trois paramètres et la version à effet aléatoire a plus de trois paramètres. Dans ce cas, le modèle aléatoire s'avère plus complexe que la version fixe. Apparemment, un passage de la version fixe à la version aléatoire est plus mis à la terre pour un plus grand. Cependant, le nombre de paramètres «cachés» dans le modèle aléatoire est inconnu, il est donc impossible de comparer les versions fixes et aléatoires sur la base des critères d'information tels que l'AIC. Par conséquent, bien que cet exemple éclaire la contribution des effets aléatoires (la possibilité d'un meilleur compromis biais-variance), il montre également qu'il est difficile de dire quand il est justifiable de renommer le facteur de fixe à aléatoire.
Aucun des problèmes ci-dessus n'est présent dans un modèle «purement fixe». Par conséquent, je suis prêt à demander:
Quelqu'un peut-il donner un exemple lorsque quelque chose de très grave s'est produit lorsqu'un facteur aléatoire a été utilisé comme s'il était fixe? Je pense qu'il devrait y avoir des études de simulation qui abordent explicitement la question.
Existe-t-il une méthode quantitative éprouvée pour décider quand il est judicieux de passer d'une étiquette fixe à une étiquette aléatoire?
Réponses:
1. Un exemple célèbre de psychologie et de linguistique est décrit par Herb Clark (1973; d'après Coleman, 1964): «L'erreur du langage comme effet fixe: une critique des statistiques linguistiques dans la recherche psychologique».
Clark est un psycholinguiste qui discute d'expériences psychologiques dans lesquelles un échantillon de sujets de recherche réagit à un ensemble de matériaux de stimulation, généralement divers mots tirés de certains corpus. Il souligne que la procédure statistique standard utilisée dans ces cas, basée sur des mesures répétées ANOVA, et désignée par Clark comme , traite les participants comme un facteur aléatoire mais (peut-être implicitement) traite les matériaux de stimulation (ou "langage") comme fixe. Cela conduit à des problèmes d'interprétation des résultats des tests d'hypothèse sur le facteur de condition expérimental: naturellement, nous voulons supposer qu'un résultat positif nous dit quelque chose à la fois sur la population à partir de laquelle nous avons prélevé notre échantillon de participants ainsi que sur la population théorique à partir de laquelle nous avons puisé. les supports linguistiques. Mais FF1 , en traitant les participants comme aléatoires et les stimuli comme fixes, ne nous dit que l'effet du facteur de condition sur d'autres participants similaires répondantexactement aux mêmes stimuli. La réalisation de l'analyse F 1 lorsque les participants et les stimuli sont mieux perçus comme aléatoires peut conduire à des taux d'erreur de type 1 qui dépassent considérablement leniveau α nominal- généralement 0,05 - dont l'étendue dépend de facteurs tels que le nombre et la variabilité des stimuli et la conception de l'expérience. Dans ces cas, l'analyse la plus appropriée, au moins dans le cadre classique de l'ANOVA, est d'utiliser ce qu'on appelle desstatistiquesquasi- F basées sur des ratios decombinaisons linéaires deF1 F1 α F carrés moyens.
L'article de Clark a fait sensation dans la psycholinguistique à l'époque, mais n'a pas réussi à percer la littérature psychologique plus large. (Et même dans le domaine de la psycholinguistique, les conseils de Clark se sont quelque peu déformés au fil des ans, comme le démontrent Raaijmakers, Schrijnemakers et Gremmen, 1999.) dans les modèles à effets mixtes, dont le modèle mixte classique ANOVA peut être considéré comme un cas particulier. Certains de ces articles récents incluent Baayen, Davidson et Bates (2008), Murayama, Sakaki, Yan et Smith (2014) et ( ahem ) Judd, Westfall et Kenny (2012). Je suis sûr qu'il y en a que j'oublie.
2. Pas exactement. Il existe des méthodes pour déterminer si un facteur est mieux inclus en tant qu'effet aléatoire ou non dans le modèle (voir par exemple, Pinheiro et Bates, 2000, p. 83-87; cependant, voir Barr, Levy, Scheepers et Tily, 2013). Et bien sûr, il existe des techniques classiques de comparaison de modèles pour déterminer si un facteur est mieux inclus en tant qu'effet fixe ou pas du tout (par exemple, lestests ). Mais je pense qu'il est généralement préférable de déterminer si un facteur est considéré comme fixe ou aléatoire comme une question conceptuelle, à laquelle il faut répondre en considérant la conception de l'étude et la nature des conclusions à en tirer.F
Un de mes instructeurs diplômés en statistique, Gary McClelland, aimait à dire que la question fondamentale de l'inférence statistique est peut-être: "Par rapport à quoi?" Après Gary, je pense que nous pouvons formuler la question conceptuelle que j'ai mentionnée ci-dessus comme suit: à quelle classe de référence de résultats expérimentaux hypothétiques je veux comparer mes résultats réels observés? En restant dans le contexte psycholinguistique et en considérant un plan expérimental dans lequel nous avons un échantillon de sujets répondant à un échantillon de mots qui sont classés dans l'une des deux conditions (le plan particulier discuté longuement par Clark, 1973), je me concentrerai sur deux possibilités:
Pour rendre cela totalement concret, voici quelques tracés de (ci-dessus) 4 ensembles de résultats hypothétiques de 4 expériences simulées sous le modèle 1; (ci-dessous) 4 ensembles de résultats hypothétiques de 4 expériences simulées sous le modèle 2. Chaque expérience affiche les résultats de deux façons: (panneaux de gauche) regroupés par sujets, avec les moyennes sujet par condition tracées et liées ensemble pour chaque sujet; (panneaux de droite) regroupés par mots, avec des diagrammes en boîte résumant la distribution des réponses pour chaque mot. Toutes les expériences impliquent 10 sujets répondant à 10 mots, et dans toutes les expériences, «l'hypothèse nulle» d'aucune différence de condition est vraie dans la population concernée.
Sujets et mots aléatoires: 4 expériences simulées
Notez ici que dans chaque expérience, les profils de réponse pour les sujets et les mots sont totalement différents. Pour les sujets, nous obtenons parfois des réponses globales faibles, parfois des réponses élevées, parfois des sujets qui ont tendance à montrer de grandes différences de condition, et parfois des sujets qui ont tendance à montrer une petite différence de condition. De même, pour les mots, nous obtenons parfois des mots qui ont tendance à susciter des réponses faibles, et parfois des mots qui ont tendance à susciter des réponses élevées.
Sujets aléatoires, Mots fixes: 4 expériences simulées
Notez ici qu'à travers les 4 expériences simulées, les sujets semblent différents à chaque fois, mais les profils de réponse pour les mots sont essentiellement les mêmes, ce qui est cohérent avec l'hypothèse que nous réutilisons le même ensemble de mots pour chaque expérience sous ce modèle.
Notre choix de savoir si nous pensons que le modèle 1 (sujets et mots tous les deux aléatoires) ou le modèle 2 (sujets aléatoires, mots fixes) fournit la classe de référence appropriée pour les résultats expérimentaux que nous avons réellement observés peut faire une grande différence dans notre évaluation du fait que la manipulation de la condition "travaillé." Nous nous attendons à plus de variations aléatoires dans les données du modèle 1 que du modèle 2, car il y a plus de «pièces mobiles». Donc, si les conclusions que nous souhaitons tirer sont plus cohérentes avec les hypothèses du modèle 1, où la variabilité des chances est relativement plus élevée, mais nous analysons nos données sous les hypothèses du modèle 2, où la variabilité des chances est relativement plus faible, alors notre erreur de type 1 Le taux de test de la différence de condition va être gonflé dans une certaine mesure (peut-être assez importante). Pour plus d'informations, consultez les références ci-dessous.
Les références
Baayen, RH, Davidson, DJ et Bates, DM (2008). Modélisation à effets mixtes avec effets aléatoires croisés pour les sujets et les objets. Journal of memory and language, 59 (4), 390-412. PDF
Barr, DJ, Levy, R., Scheepers, C., et Tily, HJ (2013). Structure des effets aléatoires pour les tests d'hypothèse de confirmation: Gardez-la maximale. Journal of Memory and Language, 68 (3), 255-278. PDF
Clark, HH (1973). L'erreur du langage comme effet fixe: une critique des statistiques linguistiques dans la recherche psychologique. Journal of verbal learning and verbal behavior, 12 (4), 335-359. PDF
Coleman, EB (1964). Généralisation à une population linguistique. Rapports psychologiques, 14 (1), 219-226.
Judd, CM, Westfall, J., et Kenny, DA (2012). Traiter les stimuli comme un facteur aléatoire en psychologie sociale: une solution nouvelle et complète à un problème omniprésent mais largement ignoré. Journal de personnalité et psychologie sociale, 103 (1), 54. PDF
Murayama, K., Sakaki, M., Yan, VX et Smith, GM (2014). L'inflation d'erreur de type I dans l'analyse traditionnelle par participant à la précision de la métamémoire: une perspective généralisée du modèle à effets mixtes. Journal of Experimental Psychology: Learning, Memory, and Cognition. PDF
Pinheiro, JC et Bates, DM (2000). Modèles à effets mixtes en S et S-PLUS. Springer.
Raaijmakers, JG, Schrijnemakers, J., et Gremmen, F. (1999). Comment faire face à «l'erreur du langage en tant qu'effet fixe»: idées fausses courantes et solutions alternatives. Journal of Memory and Language, 41 (3), 416-426. PDF
la source
Supposons que j'ai un processus de fabrication qui implique de fabriquer du matériel sur plusieurs machines différentes. Ce sont les seules machines que j'ai, donc "machine" est un effet fixe. Mais je fabrique beaucoup de matériel sur chaque machine et je suis intéressé à prédire des choses sur les futurs lots. Je vais faire du "numéro de lot" un facteur aléatoire car je suis intéressé par les résultats que j'obtiendrai pour les futurs lots.
la source
Vous les traitez donc comme aléatoires afin qu'il y ait un effet de moyenne entre la moyenne globale et la moyenne de ce facteur particulier en fonction de la taille de l'échantillon du facteur et du nombre total d'observations. Cela vous permet de dire que vos résultats s'appliquent à la population en général, car vous avez un type de moyenne pondérée et une estimation de la variation due à ce facteur, sinon, vous ne pouvez vraiment dire que vos résultats s'appliquent aux niveaux de facteur vous avez utilisé depuis la régression les traitera comme des facteurs discrets et non aléatoires qui obtiennent la moyenne pondérée.
Ils sont également utiles lorsque vous avez répété des mesures sur le même sujet, car vous pouvez les utiliser pour tenir compte de la corrélation entre les mesures sur le même sujet.
la source
(Réponse originale)
Un endroit où vous devez essentiellement utiliser des effets aléatoires est lorsque vous souhaitez inclure des paramètres invariants au niveau de regroupement de l'effet fixe.
Par exemple, supposons que vous souhaitiez étudier l'impact des caractéristiques du médecin (par exemple, la formation) sur les résultats pour les patients. L'ensemble de données est au niveau du patient avec les résultats observés et les caractéristiques du patient / médecin. Étant donné que les patients traités par un seul médecin sont probablement corrélés, vous devez contrôler cela. Vous pouvez insérer ici un effet fixe de médecin, mais ce faisant, vous excluez toute caractéristique du médecin dans le modèle. Ce qui est problématique si l'intérêt porte sur les caractéristiques de niveau médecin.
la source
Je pense que cela est lié à la cohérence des estimations.
Neyman et Scott (1948) soulignent le problème de la cohérence des
cohérent. Du moins, c'est comme ça que j'ai compris ...
la source