Quelle est la différence entre les données transversales regroupées et les données de panel?

19

Ils semblent si similaires. S'agit-il de la même chose mais simplement appelés noms différents?

Kyle
la source

Réponses:

14

Quand je vois des données de panel, je pense que des données longitudinales, donc des observations recueillies sur les mêmes individus à plusieurs reprises, sur les mêmes sujets. Les sections transversales répétées doivent être les mêmes sujets, mais vous obtenez différents échantillons d'individus à chaque observation. J'accueillerais volontiers d'autres descriptions.

Corey Sparks
la source
9

La réponse ici est assez simple: les données transversales regroupées et les données de panel pur collectent des données sur les dents (cela peut aller de 2 périodes à n'importe quel grand nombre). La principale différence entre les deux réside dans les «unités» que nous suivons. Je définis les unités comme des ménages, des pays ou tout ce sur quoi nous collectons des données. Dans une coupe transversale groupée, nous prendrons des échantillons aléatoires à différentes périodes de temps, de différentes unités, c'est-à-dire que chaque échantillon que nous prendrons sera peuplé par des individus différents. Ceci est souvent utilisé pour voir l'impact des politiques ou des programmes. Par exemple, nous prendrons les données sur le revenu des ménages des ménages X, Y et Z en 1990. Ensuite, nous prendrons les mêmes données sur le revenu des ménages G, F et A en 1995. Bien que nous soyons intéressés par les mêmes données, nous prenons différents échantillons (utilisant différents ménages) à différentes périodes.

Dans les données de panel pur, nous suivons les mêmes unités, c'est-à-dire les mêmes ménages ou individus au fil du temps. Par exemple, nous suivrons le même ensemble de ménages X, Y et Z, pour chaque période de temps nous collectons des données, c'est-à-dire en 1990 et nous interrogerons également les mêmes ménages en 1995.

Par conséquent, la différence fondamentale est simplement les unités pour lesquelles nous observons les données.

J'espère que cela t'aides.

J.Peace
la source
3

Les données transversales, ou une coupe transversale d'une population étudiée, en statistiques et en économétrie sont un type d'ensemble de données unidimensionnel. Les données transversales se réfèrent aux données collectées en observant de nombreux sujets (tels que des individus, des entreprises ou des pays / régions) au même moment, ou sans tenir compte des différences de temps. L'analyse des données transversales consiste généralement à comparer les différences entre les sujets. Par exemple, nous voulons mesurer les niveaux d'obésité actuels dans une population. Nous pourrions tirer un échantillon de 1000 personnes au hasard de cette population (également connue sous le nom de coupe transversale de cette population), mesurer leur poids et leur taille et calculer quel pourcentage de cet échantillon est classé comme obèse. Par exemple, 30% de notre échantillon ont été classés comme obèses. Cet échantillon transversal nous donne un aperçu de cette population, à ce moment précis. Notez que nous ne savons pas, sur la base d'un échantillon transversal, si l'obésité augmente ou diminue; nous pouvons seulement décrire la proportion actuelle. Les données transversales diffèrent des données de séries chronologiques également appelées données longitudinales, qui suivent les changements d'un sujet au cours du temps. Une autre variante, les données de panel (ou données transversales de séries chronologiques (TSCS)), combine les deux et examine plusieurs sujets et leur évolution au fil du temps. L'analyse par panel utilise des données de panel pour examiner les changements de variables dans le temps et les différences de variables entre les sujets. Dans une section transversale mobile, la présence d'un individu dans l'échantillon et le moment auquel l'individu est inclus dans l'échantillon sont déterminés de manière aléatoire. Par exemple, un sondage politique peut décider d'interviewer 100 000 personnes. Il sélectionne d'abord ces individus au hasard dans l'ensemble de la population. Il attribue ensuite une date aléatoire à chaque individu. Il s'agit de la date aléatoire à laquelle cette personne sera interrogée et donc incluse dans l'enquête.

Talent Zinyurugwi
la source
2

Sur la base de la définition de Corey, nous avons la méthodologie suivante pour estimer le modèle avec les données transversales regroupées et les données de panel.

Coupe transversale groupée : effets fixes unidirectionnels ou effets aléatoires (seulement le temps) ou OLS simplement mis en commun.

Données du panel: effets fixes bidirectionnels (ou un) / effets aléatoires (temporels ou individuels ou les deux) ou OLS groupés.

Métrique
la source
1

Ceci est de "Basic Econometrics" par Gujarati (4e édition, P28):

Données de panel, longitudinales ou micropanels Il s'agit d'un type spécial de données regroupées dans lesquelles la même unité transversale (par exemple, une famille ou une entreprise) est interrogée au fil du temps. Par exemple, le département américain du Commerce effectue un recensement des logements à intervalles réguliers. Lors de chaque enquête périodique, le même ménage (ou les personnes vivant à la même adresse) est interrogé pour savoir s'il y a eu un changement dans les conditions de logement et financières de ce ménage depuis la dernière enquête. En interrogeant périodiquement le même ménage, les données du panel fournissent des informations très utiles sur la dynamique du comportement des ménages.

user153922
la source
-1

Les données regroupées sont également des données de panel mais l'inverse n'est pas vrai.

Léon
la source
2
Que veux-tu dire par là? Pour répondre à la question, un exemple de l'un ou l'autre type de données serait utile, par exemple, les données de panel suivent les mêmes unités dans le temps (comme une enquête auprès des ménages telle que l'étude de panel de la dynamique du revenu), tandis que les données regroupées sont des données sur différentes années mais de différentes sections transversales (comme l'étude actuelle sur la population).
Andy
3
Parce que cela semble contredire d'autres réponses ici, il serait utile de voir une élaboration de ce que vous entendez par des données «regroupées» et «panel».
whuber