Ce problème concerne en fait la détection des incendies, mais il est fortement analogue à certains problèmes de détection de désintégration radioactive. Le phénomène observé est à la fois sporadique et très variable; ainsi, une série chronologique sera constituée de longues chaînes de zéros interrompues par des valeurs variables.
L'objectif n'est pas simplement de capturer des événements (cassures des zéros), mais une caractérisation quantitative des événements eux-mêmes. Cependant, les capteurs sont limités et enregistreront donc parfois zéro même si la "réalité" est non nulle. Pour cette raison, des zéros doivent être inclus lors de la comparaison des capteurs.
Le capteur B pourrait être plus sensible que le capteur A, et j'aimerais pouvoir le décrire statistiquement. Pour cette analyse, je n'ai pas de "vérité", mais j'ai un capteur C, qui est indépendant des capteurs A&B. Ainsi, je m'attends à ce qu'un meilleur accord entre A / B et C indique un meilleur accord avec la «vérité». (Cela peut sembler fragile, mais vous devrez me faire confiance - je suis sur une base solide ici, sur la base de ce qui est connu d'autres études sur les capteurs).
Le problème est alors de savoir comment quantifier «un meilleur accord des séries chronologiques». La corrélation est le choix évident, mais sera affectée par tous ces zéros (qui ne peuvent pas être laissés de côté), et bien sûr de manière disproportionnée par les valeurs maximales. RMSE pourrait également être calculé, mais serait fortement pondéré vers le comportement des capteurs dans le cas proche de zéro.
Q1: Quelle est la meilleure façon d'appliquer une échelle logarithmique à des valeurs non nulles qui seront ensuite combinées avec des zéros dans une analyse de séries chronologiques?
Q2: Quelles «meilleures pratiques» pouvez-vous recommander pour une analyse de séries chronologiques de ce type, où le comportement à des valeurs non nulles est au centre, mais où les valeurs nulles dominent et ne peuvent pas être exclues?
croston()
fonction duforecast
package dans R implémentera la méthode de Croston pour prévoir les données de demande intermittente.