Une autre question sur les séries chronologiques de ma part.
J'ai un ensemble de données qui donne des enregistrements quotidiens des incidents violents dans un hôpital psychiatrique sur trois ans. Avec l'aide de ma question précédente, je l'ai manipulé et j'en suis un peu plus heureux maintenant.
Ce que j'ai maintenant, c'est que la série quotidienne est très bruyante. Il varie énormément, de haut en bas, de 0 parfois jusqu'à 20. En utilisant des graphiques de Lœss et le package de prévisions (que je peux fortement recommander pour les novices comme moi), je reçois juste une ligne totalement plate, avec des intervalles de confiance massifs à partir des prévisions.
Cependant, l'agrégation hebdomadaire ou mensuelle des données a beaucoup plus de sens. Ils balaient vers le bas depuis le début de la série, puis augmentent à nouveau au milieu. Le tracé de Loess et le package de prévisions produisent tous deux quelque chose qui semble beaucoup plus significatif.
Cela ressemble cependant un peu à de la triche. Suis-je en train de préférer les versions agrégées parce qu'elles ont l'air bien sans réelle validité?
Ou serait-il préférable de calculer une moyenne mobile et de l'utiliser comme base? J'ai peur de ne pas comprendre assez bien la théorie derrière tout cela pour avoir confiance en ce qui est acceptable
la source