J'ai récemment appris à utiliser des techniques d'amorçage pour calculer les erreurs standard et les intervalles de confiance pour les estimateurs. Ce que j'ai appris, c'est que si les données sont des IID, vous pouvez traiter les données de l'échantillon comme la population et faire un échantillonnage avec remplacement, ce qui vous permettra d'obtenir plusieurs simulations d'une statistique de test.
Dans le cas des séries chronologiques, vous ne pouvez clairement pas le faire car une autocorrélation est susceptible d'exister. J'ai une série chronologique et je voudrais calculer la moyenne des données avant et après une date fixe. Existe-t-il un moyen correct de le faire en utilisant une version modifiée de l'amorçage?
time-series
bootstrap
statnub
la source
la source
Réponses:
Comme le souligne @cardinal, les variations du «block bootstrap» sont une approche naturelle. Ici, selon la méthode, vous sélectionnez des tronçons de la série chronologique, qui se chevauchent ou non et de longueur fixe ou aléatoire, ce qui peut garantir la stationnarité dans les échantillons ( Politis et Romano, 1991 ), puis les recoudre pour créer des séries temporelles rééchantillonnées sur lequel vous calculez votre statistique. Vous pouvez également essayer de construire des modèles des dépendances temporelles, conduisant aux méthodes de Markov, aux tamis autorégressifs et autres. Mais l'amorçage de blocs est probablement la plus simple de ces méthodes à implémenter.
Gonçalves et Politis (2011) est une très courte revue avec références. Un traitement de longueur de livre est Lahiri (2010) .
la source
tsboot
leboot
package dans R pour ce faire.Le rééchantillonnage basé sur un modèle est facilement adapté aux séries chronologiques. Les rééchantillons sont obtenus en simulant le modèle de série chronologique. Par exemple, si le modèle est ARIMA (p, d, q), les rééchantillons d'un modèle ARIMA (p, q) avec des MLE (de la série différenciée) des coefficients moyens autorégressifs et mobiles et la variance du bruit. Les rééchantillons sont les séquences de somme partielle du processus ARIMA simulé (p, q).
Le rééchantillonnage sans modèle des séries chronologiques est réalisé par rééchantillonnage par blocs, également appelé bloc bootstrap, qui peut être implémenté à l'aide de la fonction tsboot dans le package de démarrage de R. L'idée est de diviser la série en blocs d'observations consécutives de longueur à peu près égale, de rééchantillonner le bloc avec remplacement, puis de coller les blocs ensemble. Par exemple, si la série chronologique est de longueur 200 et que l'on utilise 10 blocs de longueur 20, alors les blocs sont les 20 premières observations, les 20 suivantes, etc. Un rééchantillonnage possible est le quatrième bloc (observation 61 à 80), puis le dernier bloc (observation 181 à 200), puis le deuxième bloc (observation 21 à 40), puis le quatrième bloc à nouveau, et ainsi de suite jusqu'à ce qu'il y ait 10 blocs dans le rééchantillonnage.
la source