Je voudrais prévoir les séries chronologiques non stationnaires, impliquant plusieurs hypothèses a priori cruciales découlant de l'étude des instances de telles séries.
J'ai construit une fonction de distribution de probabilité en un point moyennée dans le temps approximée par une distribution normale.
De ce point de vue, je veux les prévisions à ne pas dépasser lorsque . En d'autres termes, la variance de doit être délimité.La fonction de distribution de probabilité moyenne à deux points a également été construit, ce qui a conduit à l'identification de la fonction d'autocorrélation. à condition de .
Au début, le processus d'identification de Box-Jenkins m'a conduit à modèle, cependant
Je ne peux pas avoir de variance limitée avant (qui découle des équations pour les poids BJ ). En même temps, je ne peux pas utiliserpuisque l'autocorrélation initiale diminue lentement (ce qui est probablement une preuve de non-stationnarité selon BJ). C'est le principal obstacle pour moi.
Visuellement, simulation de ne coïncide pas avec le comportement de mes échantillons. Et les corrélations de première différence de la série sont en mauvais accord avec les corrélations issues du modèle.
L'analyse des résidus montre des corrélations significatives à partir du décalage 3. C'est pourquoi ma déclaration initiale est incorrect.
Essayer d'adapter différents modèles, je vois qu'il y a des corrélations résiduelles importantes proches du décalage pour chaque . Cela peut supposer que j'ai besoin modèle (comme choix limitatif), par exemple ARIMA fractionnaire.
De [1], j'ai découvert Fractional modèles qui sont en effet.
Je n'ai trouvé aucun paquet GNU R avec le support des valeurs manquantes pour cela. Les valeurs manquantes semblent être une sorte de défi.
Les publications sur ARIMA fractionné sont assez rares. Ces modèles fractionnaires sont-ils vraiment utilisés? Peut-être existe-t-il un bon remplacement des modèles ARIMA pour mes besoins? La prévision n'est pas ma principale, je n'ai qu'un intérêt pragmatique.
De la littérature différente (par exemple [2]), j'ai appris qu'il est pratiquement impossible de choisir entre ARIMA fractionnaire et les modèles avec "décalage de niveau". Cependant, je n'ai pas trouvé le package pour GNU R pour s'adapter aux modèles de «changement de niveau».
[1]: Granger, Joyeux.: J. de série chronologique anale. vol. 1 non. 1 1980, p.15
[2]: Grassi, de Magistris.: «Quand la mémoire longue rencontre le filtre de Kalman: une étude comparative», Computational Statistics and Data Analysis, 2012, sous presse.
Mise à jour: pour rendre mes propres progrès et répondre à @IrishStat
Ma déclaration sur la distribution de probabilité à deux points est incorrecte en général. Construite de cette manière, la fonction dépendra de la longueur complète de la série. Il y a donc un peu à en tirer. Au moins, paramètre nommé dépendra de la longueur complète de la série.
Les listes 2 et 3 ont également été mises à jour.
Mes données sont disponibles sous forme de fichier dat ici .
À l'heure actuelle, je doute entre FARIMA et les changements de niveau, et je ne trouve toujours pas de logiciel approprié pour vérifier ces options. C'est aussi ma première expérience avec l'identification de modèle, donc toute aide sera appréciée.
la source
Réponses:
Je n'ai jamais vu un modèle comme le processus d'identification de Box-Jenkins m'a conduit au modèle ARIMA (0,1,3) MAIS je n'avais jamais vu de cygne noir avant mon arrivée en Australie. Veuillez publier vos données car cela peut suggérer la nécessité de
Si vos données sont confidentielles, modifiez-les simplement.
OK après avoir reçu vos données (environ 80000 lectures), j'ai sélectionné 805 observations à partir du point 6287 et obtenu.
. Un point de changement significatif a été détecté à la période 137 suggérant des paramètres variant dans le temps. Les 668 observations restantes suggèrent un modèle pdq ARIMA (3,0,0) avec un décalage de niveau.étape appuyant vos conclusions préliminaires sur le décalage 3 .. Le graphique réel / ajustement / prévision est le tracé résiduel et l'acf des résidus est . Étant donné que l'acf des résidus montre une structure solide aux périodes 5 et 10, vous pourriez approfondir la structure saisonnière au décalage 5. J'espère que cela vous aidera.
la source