Quelles sont les différences entre les termes «analyse des séries chronologiques» et «analyse des données longitudinales»

17

Lorsque nous parlons de données longitudinales, nous pouvons faire référence aux données collectées au fil du temps auprès du même sujet / unité d'étude à plusieurs reprises, il existe donc des corrélations pour les observations au sein du même sujet, c'est-à-dire la similitude intra-sujet.

Lorsque nous parlons de données de séries chronologiques, nous nous référons également aux données collectées sur une série de temps et cela semble très similaire au cadre longitudinal mentionné ci-dessus.

Je me demande si quelqu'un peut apporter une clarification claire entre ces deux termes, quelle est la relation et quelles sont les différences?

demander
la source
1
Cela peut se transformer en sondage ... J'ai travaillé sur les deux types de données, et une différence clé semble être que les données longitudinales sont souvent utilisées dans les analyses causales , pour comprendre l'impact des interventions ou des traitements, alors que les séries chronologiques sont souvent utilisées dans les prévisions . Bien sûr, la différence n'est pas nette (vous devez comprendre les facteurs sous-jacents à prévoir, et à l'OMI, vous n'avez pas compris les facteurs à moins que vous puissiez bien prévoir). Mais les gens qui font la détection de signaux dans les séries temporelles ne se soucient souvent pas tellement des prévisions, ils rejetteraient probablement ma distinction.
S.Kolassa - Reinstate Monica
Merci pour vos commentaires. Mais je pense que le terme "causal" peut ne pas être approprié ici plutôt que le terme "association" devrait être meilleur? Pour ce qui est de l'objectif de l'analyse des données, je pense que vos commentaires m'ont paru logique. Mais ne pouvons-nous pas utiliser les données longitudinales pour faire des prévisions? Puisqu'il s'agit également de données de séries chronologiques.
demander
1
Vous avez un point sur «causale» vs «association», et bien sûr les données longitudinales peuvent être utilisées pour prévoir - c'est juste que je ne vois pas souvent les deux concepts ensemble. Les prévisionnistes parlent généralement de séries chronologiques. En dehors de cela, je ne pourrais pas dire mieux que @gung.
S.Kolassa - Reinstate Monica
3
L'une des différences typiques (non définitionnelles) possibles est que, dans les séries chronologiques, vous voyez et modélisez la réponse temporelle comme dépendante de l'état ; c'est l' effet de report . Dans l'analyse longitudinale du temps, vous considérez généralement le temps comme un facteur de fond évolutif permanent . tt1
ttnphns du
4
Voir aussi d'autres discussions, par exemple stats.stackexchange.com/questions/7110/… stats.stackexchange.com/questions/11413/…
Nick Cox

Réponses:

19

Je doute qu'il existe des définitions strictes et formelles sur lesquelles un large éventail d'analystes de données s'accordent.

Cependant, en général, les séries chronologiques dénotent une seule unité d'étude observée à intervalles réguliers sur une très longue période. Un exemple prototype serait la croissance annuelle du PIB d'un pays sur des décennies, voire plus de cent ans. Pour un analyste travaillant pour une entreprise privée, il peut s'agir de revenus de vente mensuels sur la durée de vie de l'entreprise. Parce qu'il y a tellement d'observations, les données sont analysées en détail, à la recherche de choses comme la saisonnalité sur différentes périodes (par exemple, mensuellement: plus de ventes au début d'un mois juste après le paiement des personnes; annuel: plus de ventes en novembre et Décembre, quand les gens achètent pour la saison de Noël), et peut-être des changements de régime. Les prévisions sont souvent très importantes, comme le note @StephanKolassa.

Longitudinal se réfère généralement à moins de mesures sur un plus grand nombre d'unités d'étude. Un exemple prototypique pourrait être un essai de médicament, où il y a des centaines de patients mesurés au départ (avant le traitement) et mensuellement pour les 3 prochains mois. Avec seulement 4 observations de chaque unité dans cet exemple, il n'est pas possible d'essayer de détecter les types de caractéristiques qui intéressent les analystes de séries chronologiques. la non-indépendance a été corrigée. Comme cela l'indique, la non-indépendance est souvent considérée comme une nuisance plutôt que comme la principale caractéristique d'intérêt.

gung - Réintégrer Monica
la source
8

Il existe environ trois types d'ensembles de données:

  • coupe transversale: différents sujets en même temps; pensez-y comme une ligne avec de nombreuses colonnes correspondant à différents sujets;
  • séries chronologiques: le même sujet à différents moments; pensez-y comme une colonne avec des lignes correspondant à différents moments;
  • panel (longitudinal): plusieurs sujets à des moments différents, vous avez le même sujet à différents moments et vous avez plusieurs sujets en même temps; pensez-y comme un tableau où les lignes sont des points temporels et les colonnes sont des sujets.
Aksakal
la source
2
D'après vos commentaires, il semble que les données longitudinales soient un ensemble de données chronologiques multiples collectées auprès de différents sujets?
demander
1
Généralement, oui, vous pouvez voir les données de chaque sujet sous forme de séries chronologiques. En pratique cependant, les données longitudinales ont souvent très peu de points de temps pour chaque sujet. Ils appellent les vagues de points de temps . Par exemple, il pourrait s'agir d'une étude médicale où chaque patient a 4 à 5 observations à intervalles mensuels et des centaines de patients au cours des années. De cette façon, les ensembles de données de panel sont souvent déséquilibrés (pensez à un tableau très clairsemé), donc les études longitudinales ont leurs propres méthodes préférées pour y faire face.
Aksakal
Cela est utile compte tenu de la question, mais il existe de nombreux autres types d'ensembles de données qui ne relèvent d'aucune de ces rubriques. Cependant, ils ne semblent pas pertinents pour la question, et essayer de classer tous les types de données possibles serait inutile ici. Exemples: tout ensemble de données dont la structure de base est sujet x sujet; tout ensemble de données qui n'est pas bidimensionnel.
Nick Cox
@ NickCox, c'est vrai, mais je suis en économétrie, et ces trois sont ceux avec des théories développées, et principalement utilisés dans notre domaine
Aksakal
2
Vous l'êtes sans doute, mais rien dans la question n'oblige ni même n'encourage un point de vue économétrique étroit, et votre point de vue spécifique n'a pas été rendu explicite.
Nick Cox
3

Ces deux termes peuvent ne pas être liés de la façon dont le PO le suppose - c'est-à-dire que je ne pense pas que ce soient des modes d'analyse concurrents.

Au lieu de cela, l'analyse des séries chronologiques décrit un ensemble de techniques de niveau inférieur qui pourraient être utiles pour analyser les données dans une étude longitudinale.

L'objet d'étude dans l'analyse des séries chronologiques est un signal dépendant du temps.

La plupart des techniques d'analyse et de modélisation / prédiction de ces signaux dépendants du temps reposent sur le principe que ces signaux sont décomposables en divers composants. Les deux plus importants sont:

  • composantes cycliques (p. ex., quotidienne, hebdomadaire, mensuelle, saisonnière); et

  • tendance

En d'autres termes, l'analyse des séries temporelles est basée sur l'exploitation de la nature cyclique d'un signal dépendant du temps pour extraire un signal sous-jacent.

doug
la source
0

Pour simplifier, je supposerai une étude des individus, mais il en va de même pour toute unité d'analyse. Ce n'est pas compliqué, les séries chronologiques sont des données collectées dans le temps, impliquant généralement la même mesure à partir d'une population équivalente à des intervalles de temps séparés - ou collectées en continu mais analysées à des intervalles temporels.
Données longitudinales de portée beaucoup plus large. La population équivalente est remplacée par la population identique, de sorte que les données individuelles peuvent être appariées ou jointes au fil du temps. Les données longitudinales peuvent être des mesures répétées ou non selon l'objectif de l'étude. Lorsque les données longitudinales ressemblent à une série chronologique, c'est lorsque nous mesurons la même chose dans le temps. La grande différence est que dans une série chronologique, nous pouvons mesurer le changement global de la mesure dans le temps (ou par groupe) tandis que dans une analyse longitudinale, vous avez réellement la mesure du changement au niveau individuel. Vous avez donc beaucoup plus de potentiel d'analyse et la mesure du changement est sans erreur si l'échantillonnage est impliqué, une étude longitudinale peut donc être plus précise et informative.

dre0303
la source