L'analyse inter-marchés est une méthode de modélisation du comportement des marchés par la recherche de relations entre différents marchés. Souvent, une corrélation est calculée entre deux marchés, par exemple le S&P 500 et les bons du Trésor américain à 30 ans. Ces calculs sont le plus souvent basés sur des données de prix, ce qui est évident pour tout le monde qu'il ne correspond pas à la définition de séries chronologiques stationnaires.
Les solutions possibles mises à part (en utilisant plutôt les retours), le calcul de corrélation dont les données sont non stationnaires est-il même un calcul statistique valide?
Diriez-vous qu'un tel calcul de corrélation est quelque peu peu fiable, ou tout simplement absurde?
correlation
stationarity
Milktrader
la source
la source
Réponses:
La corrélation mesure la relation linéaire. Dans un contexte informel, une relation signifie quelque chose de stable. Lorsque nous calculons la corrélation d'échantillon pour les variables stationnaires et augmentons le nombre de points de données disponibles, cette corrélation d'échantillon tend vers la vraie corrélation.
On peut montrer que pour les prix, qui sont généralement des marches aléatoires, la corrélation d'échantillon a tendance à varier de façon aléatoire. Cela signifie que peu importe la quantité de données dont nous disposons, le résultat sera toujours différent.
Remarque J'ai essayé d'exprimer l'intuition mathématique sans les mathématiques. D'un point de vue mathématique, l'explication est très claire: des exemples de moments de processus stationnaires convergent en probabilité en constantes. Des exemples de moments de marches aléatoires convergent vers des intégrales de mouvement brownien qui sont des variables aléatoires. Étant donné que la relation est généralement exprimée sous la forme d'un nombre et non d'une variable aléatoire, la raison du non-calcul de la corrélation pour les variables non stationnaires devient évidente.
Mise à jour Puisque nous sommes intéressés par la corrélation entre deux variables, supposons d'abord qu'elles proviennent du processus stationnaire . La stationnarité implique que et ne dépendent pas de . Donc corrélationE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt) EZt cov(Zt,Zt−h) t
ne dépend pas non plus de , puisque toutes les quantités de la formule proviennent de la matrice , qui ne dépend pas de . Ainsi, le calcul de la corrélation de l'échantillonc o v ( Z t ) tt cov(Zt) t
ρ=corr(Xt,Yt)ρ→ρT→∞√
Supposons maintenant que ne soit pas stationnaire. Alors peut dépendre de . Ainsi, lorsque nous observons un échantillon de taille nous avons potentiellement besoin d'estimer différentes corrélations . Ceci est bien sûr irréalisable, donc dans le meilleur des cas, nous ne pouvons estimer que certaines fonctions de telles que la moyenne ou la variance. Mais le résultat peut ne pas avoir d'interprétation sensée. c o r r ( X t , Y t ) t T T ρ t ρ tZt corr(Xt,Yt) t T T ρt ρt
Examinons maintenant ce qui se passe avec la corrélation de la marche aléatoire de processus non stationnaire probablement la plus étudiée. Nous appelons le processus une marche aléatoire si , où est un processus stationnaire. Pour simplifier, supposons que . ensuiteZ t = ∑ t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt) Zt=∑ts=1(Ut,Vt) Ct=(Ut,Vt) ECt=0
Pour simplifier davantage les choses, supposons que est un bruit blanc. Cela signifie que toutes les corrélations sont nulles pour . Notez que cela ne limite pas à zéro.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt) E(CtCt+h) h>0 corr(Ut,Vt)
Alors
Jusqu'ici tout va bien, bien que le processus ne soit pas stationnaire, la corrélation a du sens, même si nous avons dû faire les mêmes hypothèses restrictives.
Maintenant, pour voir ce qui arrive à la corrélation d'échantillons, nous devons utiliser le fait suivant concernant les marches aléatoires, appelé théorème de la limite centrale fonctionnelle:
s∈[0,1]Wdes =(W1s,W2s)Ms=(M1s,M2s)=(
Encore une fois pour plus de simplicité, définissons la corrélation d'échantillon comme
Commençons par les variances. On a
Cela va à l'infini lorsque augmente, nous avons donc rencontré le premier problème, la variance de l'échantillon ne converge pas. D'autre part , le théorème de cartographie continue en conjonction avec le théorème de limite centrale fonctionnelle nous donneT
T→∞
De même, nous obtenons
1
Donc, finalement, pour la corrélation de l'échantillon de notre marche aléatoire, nous obtenons
T→∞
Ainsi, bien que la corrélation soit bien définie, la corrélation d'échantillon ne converge pas vers elle, comme dans le cas d'un processus stationnaire. Au lieu de cela, il converge vers une certaine variable aléatoire.
la source
Soit une marche aléatoire discrète. Choisissez un nombre positif . Définissez les processus et par , si , et sinon ; et . En d'autres termes, commence identique à mais chaque fois que s'élève au-dessus de , il change de signe (sinon émulant à tous égards).h P V P ( 0 ) = 1 P ( t + 1 ) = - P ( t ) V ( t ) > h P ( t + 1 ) = P ( t ) V ( t ) = P ( t ) W ( t ) V W V h WW h P V P(0)=1 P(t+1)=−P(t) V(t)>h P(t+1)=P(t) V(t)=P(t)W(t) V W V h W
(Dans cette figure (pour ) est bleu et est rouge. Il y a quatre interrupteurs en signe.)W Vh=5 W V
En effet, sur de courtes périodes, tendance à être parfaitement corrélé avec ou parfaitement anticorrélé avec lui; cependant, l'utilisation d'une fonction de corrélation pour décrire la relation entre et ne serait pas utile (un mot qui capture peut-être mieux le problème que «peu fiable» ou «non-sens»).W V WV W V W
Code Mathematica pour produire la figure:
la source