Concepts derrière les modèles à effets fixes / aléatoires

14
  1. Quelqu'un peut-il m'aider à comprendre les modèles à effets fixes / aléatoires? Vous pouvez soit expliquer à votre manière si vous avez digéré ces concepts ou me diriger vers la ressource (livre, notes, site web) avec une adresse spécifique (numéro de page, chapitre etc.) afin que je puisse les apprendre sans aucune confusion.
  2. Est-ce vrai: "Nous avons des effets fixes en général et les effets aléatoires sont des cas spécifiques"? Je serais particulièrement reconnaissant d'obtenir de l'aide lorsque la description va de modèles généraux à des modèles spécifiques avec des effets fixes et aléatoires
Stat-R
la source
2
d'intérêt possible: stats.stackexchange.com/questions/4700/…
ocram
Voir les références du livre sur la balise de modèle mixte . Le numéro 1 est abordé dans (certains) chapitre d'introduction pour tous les livres de modélisation multi-niveaux que j'ai lus.
Andy W

Réponses:

13

Cela semble une grande question car elle touche un problème de nomenclature en économétrie qui dérange les étudiants lors du passage à la littérature statistique (livres, enseignants, etc.). Je vous propose http://www.amazon.com/Econometric-Analysis-Cross-Section-Panel/dp/0262232197 chapitre 10.

Supposons que votre variable d'intérêt est observée en deux dimensions (par exemple, les individus et le temps) dépend des caractéristiques observées x i t et de celles non observées u i t . Si y i t sont des salaires observés, nous pouvons affirmer qu'ils sont déterminés par les compétences observées (éducation) et non observées (talents, etc.). Mais il est clair que les compétences non observées peuvent être corrélées avec les niveaux d'éducation. Cela conduit donc à la décomposition d'erreur: u i t = e i t + v iv iyjetXjetujetyjetujet=ejet+vjevjeest la composante d'erreur (aléatoire) que nous pouvons supposer corrélée avec les . c'est-à-dire que v i modélise les compétences non observées de l'individu comme une composante individuelle aléatoire.Xvje

Ainsi le modèle devient:

yjet=jθjXj+ejet+vje

Ce modèle est généralement étiqueté comme un modèle FE, mais comme Wooldridge fait valoir qu'il serait plus sage d'appeler un modèle RE avec le composant d'erreur corrélative alors que si décorrélée la x ' s il devient un modèle RE. Donc, cela répond à votre deuxième question, la configuration FE est plus générale car elle permet une corrélation entre v i et levjexsvi .xs

Les livres plus anciens en économétrie ont tendance à se référer à FE à un modèle avec des constantes spécifiques individuelles, malheureusement cela est toujours présent dans la littérature de nos jours (je suppose que dans les statistiques ils n'ont jamais eu cette confusion. Je suggère définitivement les conférences Wooldridge qui développent le problème potentiel de malentendu )

JDav
la source
Merci pour le lien vers (1) Excellente ressource et (2) belle explication
Stat-R
1
C'est une façon d'expliquer ces idées différente de ce que j'ai l'habitude de voir, mais vraiment bien fait. +1
gung - Réintègre Monica
15

Mon meilleur exemple d'effet aléatoire dans un modèle provient d'études d'essais cliniques. Dans les essais cliniques, nous recrutons des patients de divers hôpitaux (appelés sites). Les sites sont sélectionnés parmi un large éventail de sites potentiels. Il peut y avoir des facteurs liés au site qui affectent la réponse au traitement. Ainsi, dans un modèle linéaire, vous souhaiterez souvent inclure le site comme effet principal.

Mais est-il approprié d'avoir un site comme effet fixe? Nous ne faisons généralement pas cela. Nous pouvons souvent considérer les sites que nous avons sélectionnés pour l'essai comme un échantillon aléatoire parmi les sites potentiels que nous aurions pu sélectionner. Ce n'est peut-être pas tout à fait le cas, mais cela peut être une hypothèse plus raisonnable que de supposer que l'effet du site est fixe. Ainsi, le fait de traiter le site comme un effet aléatoire nous permet d'incorporer la variabilité de l'effet de site qui est due au choix d'un ensemble de k sites dans une population contenant N sites.

L'idée générale est que le groupe n'est pas fixe mais a été sélectionné dans une population plus large et que d'autres choix pour le groupe étaient possibles et auraient conduit à des résultats différents. Donc, le traiter comme un effet aléatoire incorpore ce type de variabilité dans le modèle que vous n'obtiendrez pas avec un effet fixe.

Michael R. Chernick
la source
La référence @ocram est assez intéressante. Il souligne l'hétérogénéité des définitions FE. Mais à quelle définition se réfère Stat-R? Ses deuxièmes questions suggèrent que FE est considéré comme un RE avec une composante aléatoire corrélée. Selon cette définition et dans votre exemple, un FE signifierait qu'un traitement pourrait être corrélé avec un effet de site non observé (ou omis), non?
JDav
2
Bien - votre dernier paragraphe est une façon très succincte de le dire. +1
Luke
1
@MichaelChernick: bel exemple. Vous soutenez donc que le site hospitalier devrait être traité comme un effet aléatoire et non comme un effet fixe. Mais quelle serait la différence réelle dans le résultat entre ces deux options? Si nous le considérons comme fixe, nous obtiendrons un coefficient de régression pour chaque hôpital et nous pourrons par exemple tester si l'effet principal de l'hôpital est significatif. Si nous traitons de manière aléatoire, nous n'obtiendrons pas de coefficient de régression pour chaque hôpital (correct?); peut-on encore tester l'effet principal de l'hôpital? Plus important encore, cela peut-il augmenter / diminuer la puissance d'autres effets / interactions principaux dans le modèle?
Amoeba dit Reinstate Monica
12
  1. Pas sûr d'un livre mais voici un exemple. Supposons que nous ayons un échantillon de poids à la naissance d'une grande cohorte de bébés sur une longue période. Le poids des bébés nés de la même femme serait plus similaire à celui des bébés nés de mères différentes. Les garçons sont également plus lourds que les filles.

Ainsi, un modèle à effets fixes ignorant la corrélation des poids entre les bébés nés de la même mère est:

Modèle 1. poids de naissance moyen = interception + sexe

Un autre modèle à effets fixes ajustant cette corrélation est:

Modèle 2. poids de naissance moyen = interception + sexe + id_mère

Cependant, premièrement, nous pourrions ne pas être intéressés par les effets pour chaque mère en particulier. De plus, nous considérons que la mère est une mère choisie au hasard parmi la population de toutes les mères. Nous construisons donc un modèle mixte avec un effet fixe pour le sexe et un effet aléatoire (ie une interception aléatoire) pour la mère:

Modèle 3: poids de naissance moyen = interception + sexe + u

Ce u sera différent pour chaque mère, tout comme dans le modèle 2, mais il n'est pas réellement estimé. Au contraire, seule sa variance est estimée. Cette estimation de la variance nous donne une idée du niveau de regroupement des poids par mère.

J'espère que cela a du sens.

Gavin
la source