Cette méthode de rééchantillonnage des séries chronologiques est-elle connue dans la littérature? At-il un nom?

14

Je cherchais récemment des moyens de rééchantillonner des séries chronologiques,

  1. Préserve approximativement l'auto-corrélation des longs processus de mémoire.
  2. Préserver le domaine des observations (par exemple une série temporelle rééchantillonnée d'entiers est toujours une série temporelle d'entiers).
  3. Peut affecter certaines échelles uniquement, si nécessaire.

J'ai trouvé le schéma de permutation suivant pour une série chronologique de longueur 2N :

  • Regroupez les séries chronologiques par paires d'observations consécutives (il existe 2N1 ces casiers). Flip chacun d'entre eux ( ie index à partir 1:2de 2:1) indépendamment avec probabilité 1/2 .
  • Regroupez les séries chronologiques obtenues par 4 observations consécutives (il y a 2N2 ces casiers). Inverser chacun d'entre eux ( c. -à- index à partir 1:2:3:4de 4:3:2:1) independelty avec une probabilité 1/2 .
  • Répétez la procédure avec des bacs de taille , 16 , ..., 2 N - 18162N1 inverser toujours les bacs avec une probabilité .1/2

Cette conception était purement empirique et je recherche des travaux qui auraient déjà été publiés sur ce type de permutation. Je suis également ouvert aux suggestions d'autres permutations ou schémas de rééchantillonnage.

gui11aume
la source
Votre procédure est intéressante mais comme vous la décrivez, il me semble que si est la taille de bloc maximale, vous partitionnez essentiellement vos données en 2 ( N - k ) blocs consécutifs, puis dans chaque paire de permutations de blocs, chaque instance étant égale -probable. 2k2(Nk)
muratoa
Au lieu de paires, vous pouvez définir et k max . De cette façon, vous vous assurez qu'au moins 2 k points min sont préservés et pouvez déplacer une distance au plus 2 k max . kminkmax2kmin2kmax
muratoa
@muratoa merci pour vos commentaires. Je ne suis pas sûr de suivre. Si est la taille de bloc maximale, le schéma n'est pas comme permuter des paires dans des blocs. Par exemple, pour k = 2 , vous pouvez obtenir l'ordre avec une probabilité 1/8, qui n'est pas une permutation de paires. En ce qui concerne k min et k max , c'est ce à quoi je fais référence au point 3. C'est la façon de mélanger les échelles de k min et k max . 2kk=24:3:2:1kminkmaxkminkmax
gui11aume
Google "données de substitution ajustées en amplitude" créées par James Theiler et / ou jetez un œil aux méthodes de rééchantillonnage des données dépendantes de Lahiri.
PeterR
vous avez raison, je n'ai pas lu correctement votre première puce, je pensais que la taille
minimale

Réponses:

14

Si vous incluez le dernier casier de taille , la permutation aléatoire est uniformément choisie parmi le produit de couronne itéré de groupes d'ordre 2 , noté C 2C 2. . . C 2 . (Si vous omettez le dernier renversement possible, vous obtenez alors un échantillon uniforme d'un sous-groupe d' index 2 , le produit de deux produits de couronnes itérées avec N - 1 facteurs.) C'est également le sous-groupe Sylow 2 du groupe symétrique sur 2 N 22N2C2C2...C22N122N éléments (un plus grand sous-groupe d'ordre d'une puissance de2- tous ces sous-groupes sont conjugués). C'est aussi le groupe de symétries d'un arbre binaire parfait avec feuilles toutes au niveau N (en comptant la racine comme niveau 0 ).2NN0

entrez la description de l'image ici

Beaucoup de travail a été fait sur des groupes comme celui-ci sur le plan mathématique, mais une grande partie peut ne pas vous concerner. J'ai pris l'image ci-dessus d'une question récente de MO sur les sous-groupes maximaux du produit de couronne itéré.

Douglas Zare
la source
Génial (+1) !! Merci pour la référence au produit couronne et au sous-groupe Sylov 2. Oublier la dernière réversion (en haut) était une erreur, en fait elle est incluse dans le schéma.
gui11aume