Un test de signification habituel lors de l'examen de deux populations est le test t, le test t apparié si possible. Cela suppose que la distribution est normale.
Existe-t-il des hypothèses simplificatrices similaires qui produisent un test de signification pour une série chronologique? Plus précisément, nous avons deux populations de souris assez petites qui sont traitées différemment, et nous mesurons le poids une fois par semaine. Les deux graphiques affichent des fonctions qui augmentent progressivement, avec un graphique nettement au-dessus de l'autre. Comment quantifier le «caractère définitif» dans ce contexte?
L'hypothèse nulle devrait être que les poids des deux populations "se comportent de la même manière" au fil du temps. Comment peut-on formuler cela en termes d'un modèle simple qui est assez courant (tout comme les distributions normales sont communes) avec seulement un petit nombre de paramètres? Une fois cela fait, comment peut-on mesurer la signification ou quelque chose d'analogue aux valeurs de p? Qu'en est-il du jumelage des souris, correspondant à autant de caractéristiques que possible, chaque paire ayant un représentant de chacune des deux populations?
Je souhaiterais un pointeur vers un livre ou un article pertinent, bien écrit et facile à comprendre sur les séries chronologiques. Je commence comme un ignorant. Merci de votre aide.
David Epstein
la source
Réponses:
Il existe de nombreuses façons de le faire si vous considérez les variations de poids comme un processus dynamique.
Par exemple, il peut être modélisé comme un intégrateurX˙( t ) = θ x ( t ) + v ( t )
où est la variation de poids, correspond à la vitesse à laquelle le poids change et est une perturbation stochastique qui peut affecter la variation de poids. Vous pouvez modéliser comme , pour un connu (vous pouvez également l'estimer).x ( t ) θ v ( t ) v ( t ) N( 0 , Q ) Q
De là, vous pouvez essayer d'identifier le paramètre pour les deux populations (et leur covariance), en utilisant, par exemple, une méthode d'erreur de prédiction. Si l'hypothèse gaussienne est vraie, les méthodes d'erreur de prédiction donneront que l'estimation de est également gaussienne (asymptotiquement) et vous pouvez donc construire un test d'hypothèse pour déterminer si l'estimation de est statistiquement proche de celle de .θ θ θ1 θ2
Pour référence, je peux suggérer ce livre .
la source
Je suggère d'identifier un modèle ARIMA pour chaque souris séparément, puis de les examiner pour les similitudes et la généralisation. Par exemple, si la première souris a un AR (1) et la seconde a un AR (2), le modèle le plus général (le plus grand) serait un AR (2). Estimer ce modèle à l'échelle mondiale, c'est-à-dire pour les séries chronologiques combinées. Comparez la somme des carrés d'erreur pour l'ensemble combiné avec la somme des deux somme d'erreur individuelle des carrés pour générer une valeur F pour tester l'hypothèse de paramètres constants à travers les groupes. Je souhaite que vous puissiez publier vos données et je vais illustrer ce test avec précision.
COMMENTAIRES SUPPLÉMENTAIRES:
Étant donné que l'ensemble de données est auto-corrélé, la normalité ne s'applique pas. Si les observations sont indépendantes dans le temps, alors on pourrait appliquer certaines des méthodes bien connues de séries non temporelles. En ce qui concerne votre demande concernant un livre facile à lire sur les séries chronologiques, je suggère le texte Wei d'Addison-Wesley. Les spécialistes des sciences sociales trouveront l'approche non mathématique de Mcleary et Hay (1980) plus intuitive mais manquant de rigueur.
la source