Prédire les processus à longue mémoire

11

Je travaille avec un processus à deux états avec dans pourXt{1,-1}t=1,2,

La fonction d'autocorrélation est indicative d'un processus à mémoire longue, c'est-à-dire qu'elle affiche une décroissance de la loi de puissance avec un exposant <1. ​​Vous pouvez simuler une série similaire en R avec:

> library(fArma)
> x<-fgnSim(10000,H=0.8)
> x<-sign(x)
> acf(x)

Ma question: existe-t-il un moyen canonique de prédire de manière optimale la prochaine valeur de la série étant donné uniquement la fonction d'autocorrélation? Une façon de prédire consiste simplement à utiliser

X^(t)=X(t-1)

qui a un taux de classification de , où est l'autocorrélation lag-1, mais je pense qu'il doit être possible de faire mieux en tenant compte de la structure à longue mémoire.(1+ρ1)/2ρ

Chris Taylor
la source
1
Je pense qu'une partie du problème réside dans le fait que le processus que vous avez défini n'est pas entièrement défini par les caractéristiques que vous avez énumérées. Pour un échantillon de taille , vous avez donné contraintes linéaires pour paramètres. De nombreux processus pourraient satisfaire aux contraintes et pourtant conduire à différents taux de classification réalisables. Votre Code ne définit de façon unique un processus, mais il vous semblait prévu que comme un exemple concret et non comme l'objet principal d'intérêt. n(n2)2nR
Cardinal
@cardinal, le problème devrait avoir une solution connue, qui se trouve probablement dans la série chronologique W.Palma Long Memory: Théorie et méthodes. Le fait est que la fonction d'autocorrélation peut être utilisée pour obtenir par le système d'équations de Yule Walker les paramètres de représentation du processus, le point est quand une telle représentation existe (inversibilité) et quelle troncature est acceptable par le biais de dire MSE. Pour le code dans mon doctorat, j'ai utilisé le package. UNER()Rfracdiff
Dmitrij Celov
@Dmitrij, @Chris, l'OP déclare spécifiquement qu'il est intéressé par les processus à valeur binaire (j'ai une assez bonne idée de ce qui l'intéresse probablement), pour lequel une formulation AR via Yule-Walker me semblerait ad- hoc au moins. Vous pourriez peut-être jeter une logistique autour d'elle pour estimer une probabilité conditionnelle, mais il est toujours important de reconnaître les hypothèses que l'on fait dans ce cas. De plus, pour les processus à mémoire longue, le choix de la troncature peut être important et induire des artefacts non triviaux.
cardinal
1
@cardinal, @Chris. oh, comme d'habitude, j'ai raté la partie de la tâche ^ __ ^ Dans le cas des processus à valeur binaire, il semble que ce soit un problème très bien connu (étudié) de mesure du trafic qui provient des réseaux de communication ou soi-disant processus ON / OFF qui présente une dépendance de longue portée (mémoire longue). En ce qui concerne l'exemple particulier, je suis un peu confus, car dans "une façon de prédire" Chris prend en fait la valeur précédente, n'utilisant pas uniquement l'ACF (ou je suis encore plus confus par le terme "taux de classification").
Dmitrij Celov
J'imagine qu'il serait possible de prendre le code d'un modèle auto-régressif fractionnellement intégré et de changer la fonction de vraisemblance pour incorporer un effet probit. Ensuite, vous pourriez obtenir la probabilité de ou . 1-1
John

Réponses:

1

Avez-vous essayé "Chaînes de Markov à longueur variable", VLMC L'article est "Chaînes de Markov à longueur variable: méthodologie, informatique et logiciels", Martin MACHLER et Peter BUHLMANN, 2004, Journal of Computational and Graphical Statistics, Vol. 13, n ° 2.

Stat
la source