Test d'hypothèse et signification pour les séries chronologiques

19

Un test de signification habituel lors de l'examen de deux populations est le test t, le test t apparié si possible. Cela suppose que la distribution est normale.

Existe-t-il des hypothèses simplificatrices similaires qui produisent un test de signification pour une série chronologique? Plus précisément, nous avons deux populations de souris assez petites qui sont traitées différemment, et nous mesurons le poids une fois par semaine. Les deux graphiques affichent des fonctions qui augmentent progressivement, avec un graphique nettement au-dessus de l'autre. Comment quantifier le «caractère définitif» dans ce contexte?

L'hypothèse nulle devrait être que les poids des deux populations "se comportent de la même manière" au fil du temps. Comment peut-on formuler cela en termes d'un modèle simple qui est assez courant (tout comme les distributions normales sont communes) avec seulement un petit nombre de paramètres? Une fois cela fait, comment peut-on mesurer la signification ou quelque chose d'analogue aux valeurs de p? Qu'en est-il du jumelage des souris, correspondant à autant de caractéristiques que possible, chaque paire ayant un représentant de chacune des deux populations?

Je souhaiterais un pointeur vers un livre ou un article pertinent, bien écrit et facile à comprendre sur les séries chronologiques. Je commence comme un ignorant. Merci de votre aide.

David Epstein

David Epstein
la source
Vous voudrez peut-être jeter un filet plus large, car ce n'est pas nécessairement une question de série chronologique. En effet, la question peut-être la plus fondamentale ici concerne la meilleure ou du moins la bonne façon de quantifier un «critère» de traitement: s'agit-il de la croissance d'une population après un certain temps, des taux de croissance moyens dans le temps, etc.? Si vous ne le saviez pas avant de commencer l'expérience et que vous remarquiez soudainement des différences constantes dans les courbes de croissance, alors vous travaillez dans un mode exploratoire , pas confirmatif, et les valeurs de p de test d'hypothèse seront trompeusement bonnes.
whuber
Le résultat est qualitativement comme prévu, et un test unilatéral semble approprié. La raison pour laquelle j'ai posé une question sur les séries chronologiques, c'est que si l'on ne mesure que le poids final (qui est la mesure la plus pertinente), alors on jette toutes les informations des points temporels précédents, et cela semble faux.
David Epstein
Vous avez raison: vous ne voulez pas jeter ces données. Mais les techniques de séries chronologiques sont mises en avant pour les modèles de données où les corrélations temporelles des écarts par rapport aux courbes idéalisées sont importantes, soit pour leur propre intérêt, soit parce qu'elles pourraient interférer avec une bonne estimation. Votre situation n'est pas susceptible de tomber dans l'un ou l'autre de ces cas. Des méthodes plus simples et plus significatives sur le plan scientifique sont disponibles.
whuber
@whuber, le poids dans le temps de l'ensemble de contrôle des souris n'est-il pas une "courbe idéalisée" dans un certain sens? Ou du moins, un modèle théorique adapté à ces données?
naught101
1
Oui, @naught, c'est une façon raisonnable de voir les choses. Mais «courbe» n'est pas la même chose que «série chronologique». Par exemple, la régression linéaire peut être (et est souvent) considérée comme ajustant les courbes aux données, mais elle est distincte de l'analyse des séries chronologiques, qui met l'accent sur la structure des corrélations entre les écarts entre les données et la courbe idéalisée.
whuber

Réponses:

1

Il existe de nombreuses façons de le faire si vous considérez les variations de poids comme un processus dynamique.

Par exemple, il peut être modélisé comme un intégrateur X˙(t)=θX(t)+v(t)

où est la variation de poids, correspond à la vitesse à laquelle le poids change et est une perturbation stochastique qui peut affecter la variation de poids. Vous pouvez modéliser comme , pour un connu (vous pouvez également l'estimer).X(t)θv(t)v(t)N(0,Q)Q

De là, vous pouvez essayer d'identifier le paramètre pour les deux populations (et leur covariance), en utilisant, par exemple, une méthode d'erreur de prédiction. Si l'hypothèse gaussienne est vraie, les méthodes d'erreur de prédiction donneront que l'estimation de est également gaussienne (asymptotiquement) et vous pouvez donc construire un test d'hypothèse pour déterminer si l'estimation de est statistiquement proche de celle de .θθθ1θ2

Pour référence, je peux suggérer ce livre .

andrecb
la source
0

Je suggère d'identifier un modèle ARIMA pour chaque souris séparément, puis de les examiner pour les similitudes et la généralisation. Par exemple, si la première souris a un AR (1) et la seconde a un AR (2), le modèle le plus général (le plus grand) serait un AR (2). Estimer ce modèle à l'échelle mondiale, c'est-à-dire pour les séries chronologiques combinées. Comparez la somme des carrés d'erreur pour l'ensemble combiné avec la somme des deux somme d'erreur individuelle des carrés pour générer une valeur F pour tester l'hypothèse de paramètres constants à travers les groupes. Je souhaite que vous puissiez publier vos données et je vais illustrer ce test avec précision.

COMMENTAIRES SUPPLÉMENTAIRES:

Étant donné que l'ensemble de données est auto-corrélé, la normalité ne s'applique pas. Si les observations sont indépendantes dans le temps, alors on pourrait appliquer certaines des méthodes bien connues de séries non temporelles. En ce qui concerne votre demande concernant un livre facile à lire sur les séries chronologiques, je suggère le texte Wei d'Addison-Wesley. Les spécialistes des sciences sociales trouveront l'approche non mathématique de Mcleary et Hay (1980) plus intuitive mais manquant de rigueur.

IrishStat
la source
1
Cela ne semble vraiment pas résoudre les problèmes fondamentaux. (1) Pourquoi un tel modèle est-il approprié? (2) Pourquoi chaque souris devrait-elle être modélisée et non, disons, les poids moyens de la population ou les gains de poids? (3) Pourquoi un test de paramètres constants est-il pertinent? La question demande un test unilatéral. La plupart des paramètres que vous mentionnez ne semblent pas pertinents sur le plan scientifique et ne quantifient pas directement le sentiment qu'un graphique est constamment supérieur à l'autre. (4) Comment contrôlez-vous les éventuelles différences de caractéristiques des deux populations au début de l'expérience?
whuber
: alors que le test de constance des paramètres est pertinent car vous avez un ensemble de coefficients pour le premier groupe de lectures de la souris 1 et un deuxième ensemble de coefficients pour la 2e souris. La question est "existe-t-il collectivement une différence significative entre les coefficients". Continuez maintenant avec votre commentaire, étant donné que l'un des coefficients du modèle peut être une constante et si c'est le cas, la différence entre les coefficients peut être due au fait que les constantes sont statistiquement différentes les unes des autres.Notez que le modèle ARIMA sous-jacent peut ne pas nécessairement avoir une constante car il peut s'agir d'un modèle de différence.
IrishStat
1
Je pense que vous avez en partie raison, mais vous devez affiner votre caractérisation du problème. De nombreux coefficients ARIMA peuvent ne pas être scientifiquement pertinents. Par exemple, si l'un d'eux agit comme un terme quadratique au fil du temps, une différence pourrait dire quelque chose sur la forme des courbes de croissance, mais cela pourrait être de peu d'utilité. Si l'on choisit des coefficients pour refléter le (s) critère (s) expérimental (s) et ne teste que ceux-ci, certains bien pourraient être obtenus de cette façon. En général, cependant, les modèles de séries chronologiques introduisent des coefficients (par exemple, l'autocorrélation) peu susceptibles d'être d'un intérêt scientifique direct ici.
whuber
whuber: "Si l'on choisit des coefficients pour refléter le (s) critère (s) expérimental (s) et ne les teste que, certains bien pourraient être obtenus" n'a pas beaucoup de sens pour moi car il ignore les points intermédiaires. Contrairement à votre commentaire, le mode série chronologique et les coefficients qui l'accompagnent présentent un intérêt scientifique important car il caractérise la distribution des lectures et les convertit en un processus aléatoire (le terme d'erreur) qui est exempt de structure autocorrélative et ensuite soumis à des tests exigeant la normalité. Le test que je propose requiert cette hypothèse.
IrishStat
1
L'autocorrélation peut être de peu d'importance ici. L'intérêt se concentre explicitement sur les tendances: comment les courbes de croissance sous-jacentes ont-elles tendance à différer entre les deux populations? Les paramètres d'autocorrélation sont des paramètres de nuisance, à introduire et à traiter uniquement dans la mesure où ils pourraient aider à améliorer l'estimation de ces courbes de croissance. La première priorité est d'adopter un modèle scientifique de la croissance, de représenter ce modèle avec des paramètres interprétables et intéressants et de les estimer . Il est peu probable que l'application automatique de techniques de séries chronologiques y parvienne.
whuber