Quelle résolution temporelle pour le test de signification des séries chronologiques?

9

J'ai besoin de conseils sur le niveau de mise en commun approprié à utiliser pour les tests de différence de moyens sur les données de séries chronologiques. Je m'inquiète de la pseudo-réplication temporelle et sacrificielle, qui semble être en tension sur cette application. Cela fait référence à une étude mensurale plutôt qu'à une expérience de manipulation.

Envisagez un exercice de surveillance : un système de capteurs mesure la teneur en oxygène dissous (OD) à de nombreux endroits sur la largeur et la profondeur d'un étang. Les mesures pour chaque capteur sont enregistrées deux fois par jour, car le DO est connu pour varier en diurne. Les deux valeurs sont moyennées pour enregistrer une valeur quotidienne. Une fois par semaine, les résultats quotidiens sont agrégés spatialement pour arriver à une seule concentration hebdomadaire d'OD pour l'ensemble de l'étang.

Ces résultats hebdomadaires sont présentés périodiquement, et agrégés davantage - les résultats hebdomadaires sont moyennés pour donner une concentration mensuelle d'OD pour l'étang. Les résultats mensuels sont moyennés pour donner une valeur annuelle. Les moyennes annuelles sont elles-mêmes moyennées pour rendre compte des concentrations décennales d'OD pour l'étang.

Le but est de répondre à des questions telles que: la concentration d'OD de l'étang au cours de l'année X était-elle supérieure, inférieure ou identique à la concentration de l'année Y? La concentration moyenne d'OD des dix dernières années est-elle différente de celle de la décennie précédente? Les concentrations d'OD dans un étang répondent à de nombreuses entrées de grande ampleur et varient donc considérablement. Un test de signification est nécessaire. La méthode consiste à utiliser une comparaison T-test des moyennes. Étant donné que les valeurs décennales sont la moyenne des valeurs annuelles et que les valeurs annuelles sont la moyenne des valeurs mensuelles, cela semble approprié.

Voici la question - vous pouvez calculer les moyennes décennales et les valeurs T de ces moyennes à partir des valeurs mensuelles d'OD ou des valeurs annuelles d'OD. La moyenne ne change pas bien sûr, mais la largeur de l'intervalle de confiance et la valeur T le font. En raison de l'ordre de grandeur plus élevé de N atteint en utilisant des valeurs mensuelles, l'IC se resserre souvent considérablement si vous suivez cette voie. Cela peut donner la conclusion opposée par rapport à l'utilisation des valeurs annuelles par rapport à la signification statistique d'une différence observée dans les moyennes, en utilisant le même test sur les mêmes données. Quelle est la bonne interprétation de cet écart?

Si vous utilisez les résultats mensuels pour calculer les statistiques de test pour une différence dans les moyennes décennales, rencontrez-vous une pseudoréplication temporelle? Si vous utilisez les résultats annuels pour calculer les tests décennaux, sacrifiez-vous des informations et donc une pseudo-réplication?


la source
Votre question est plutôt délicate ... j'y pense.
deps_stats

Réponses:

1

Je crois que vous essayez d'utiliser des méthodes statistiques appropriées pour des observations indépendantes alors que vous avez des données corrélées, à la fois temporairement et spatialement. Si vous avez des observations disons pendant 5 heures et décidez de reformuler ceci comme 241 observations prises chaque minute, vous n'avez vraiment pas 240 degrés de liberté par rapport à la moyenne de ces 241 valeurs. L'autocorrélation produit potentiellement une surestimation de la taille de "N" et crée ainsi de fausses déclarations d'incertitude. Ce que vous devez faire est de trouver quelqu'un / un manuel / un site Web / .... pour vous enseigner les données des séries chronologiques et leur analyse. Une façon de commencer est de GOOGLE "aidez-moi à comprendre les séries chronologiques" et commencez à lire / apprendre. Il y a beaucoup de matériel disponible sur le Web.http://www.autobox.com/AFSUniversity/afsuFrameset.htm . Je mentionne cela car je suis toujours associé à cette entreprise et ses produits, donc mes commentaires sont "biaisés et d'opinion" mais pas uniquement égoïstes.

IrishStat
la source