Que fait exactement une marche aléatoire?

8

Pour être honnête, j'ai lu de nombreux sites Web et réponses concernant cette question, et aucun ne l'a expliquée en termes simples et compréhensibles. Ce que je veux faire, c'est comprendre ce que fait une marche aléatoire et comment elle peut être utilisée pour l'analyse d'enrichissement des ensembles de gènes.

Il y a un article publié ici http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ cependant, je ne pouvais pas vraiment le comprendre.

Quelqu'un peut-il expliquer ce qu'il fait en termes simples?

Apprenant
la source
2
Ce sont deux questions très différentes!
Alexis
1
@Alexis J'ai accepté ta révision, j'espère que maintenant c'est clair!
Apprenant
1
@Nemo J'ai supprimé les balises non liées et ajouté une balise de série chronologique . N'hésitez pas à modifier mes modifications ou à ajouter des balises supplémentaires, mais les balises comme r , la signification statistique ou les mathématiques ne semblent pas liées ici.
Tim

Réponses:

11

Je vais essayer de répondre à votre première question

Une marche aléatoire est une série de mesures dans lesquelles la valeur à un point donné de la série est la valeur du point précédent de la série plus une certaine quantité aléatoire.

Par exemple, supposons que vous lancez une pièce juste dans une série de lancers, et chaque fois que la pièce monte, vous ajoutez 1 à la valeur précédente de votre variable série, et chaque fois que la pièce arrive pile, vous soustrayez 1 de la valeur précédente. de votre variable série. Si la valeur de départ est 0 et si vous retournez la séquence suivante de lancers de pièces:

T H T T T H H H T T H T H T H

La marche aléatoire ,y sur la base de ces valeurs telles que décrites ci-dessus serait:

0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1

Donc, la valeur de y est:

yt=yt1+2Bernoulli(0.5)1

La distribution de dépend du temps , ce qui donne des propriétés intéressantes à un échantillon de à différents moments:yty

  1. La moyenne de n'est pas définie. yCela peut sembler contre-intuitif, car vous pourriez vous attendre à ce que les têtes et les queues d'une pièce équilibrée soient centrées sur zéro. C'est vrai dans la mesure où cela va, mais zéro n'était qu'une valeur de départ arbitraire de . yIl n'y a donc pas de véritable moyen!

  2. La variance de . y=tÀ mesure que le temps (le nombre de flips) augmente, la variance augmente également. Par exemple, au premier flip ( ), les valeurs possibles sont ou , et en effet la variance est alors 1. Mais au deuxième flip ( ) les valeurs possibles sont , ou , et la variance est égale à 2. Pour un nombre infini de flips (à , lorsque la plage de toutes les valeurs possibles de va de à ), la variance est infinie.t=111t=2202t=y

Ces deux faits font des ravages en essayant de tirer des inférences sur la distribution de (plutôt que pour un donné) étant donné seulement un échantillon lors de l'utilisation des outils de base de l'inférence statistique. (Comment un fini estimation non défini ? Comment un fini estimation ?)yyty0y¯sy2σy2=

Il existe de nombreux types de marches aléatoires et, plus généralement, de processus autogrégressifs (c'est-à-dire toute variable qui dépend en quelque sorte de ses valeurs précédentes). L'exemple ici utilise une simple variable aléatoire de Bernouli (le tirage au sort), mais on pourrait:

  • ajouter une valeur aléatoire normalement distribuée à des valeurs successives de place ... ou bien une valeur aléatoire tirée de toute sorte de distribution;y
  • faire dépendre la valeur de à un moment donné des valeurs précédentes de à plusieurs moments (par exemple );yyyt=yt1+yt2+Something Random
  • associer la valeur de à une valeur aléatoire de pour créer une marche aléatoire bidimensionnelle;yx
  • faire de une fonction fantaisiste de , un exemple simple est , où , ce qui signifie que la mémoire de tout moment spécifique de se désintègre dans le temps (avec la mémoire qui dure plus longtemps est proche de 1) - selon les commentaires d'Alecos, ce serait simplement «autorégressif» (une marche aléatoire pure aurait );ytyt1yt=αyt1+Something Random|α|<1y |α||α|=1
  • faire beaucoup d'autres choses pour rendre les marches aléatoires et / ou les processus autorégressifs plus complexes.

Mais ce sont tous les Dickens à essayer d'analyser en utilisant les méthodes de base. C'est pourquoi nous avons des régressions de cointégration et des modèles de correction d'erreurs et d'autres techniques d'analyse de séries chronologiques pour traiter ce type de données (que nous appelons parfois «non intégrées», «à mémoire longue» ou «racine unitaire» entre autres étiquettes). , selon les détails).

L'origine du terme "marche aléatoire" provient d'une paire de très brèves lettres à Nature en 1905.

Références
Pearson, K. (1905). Lettres à l'éditeur: Le problème de la marche aléatoire. Nature , 72 (1865): 294.

Pearson, K. (1905). Lettres à l'éditeur: Le problème de la marche aléatoire. Nature , 72 (1867): 342.

Alexis
la source
2
Vous écrivez "Une marche aléatoire est une série de mesures dans laquelle la valeur à un point donné de la série dépend des valeurs des points précédents de la série." Mais cela décrit tout processus autorégressif, et toutes les processeurs autorégressives ne sont pas des marches aléatoires. Puisque, de toute évidence, vous connaissez le sujet, je pense qu'il serait utile que vous révisiez cette déclaration afin de faire ressortir la ou les caractéristiques uniques d'une marche aléatoire.
Alecos Papadopoulos
@AlecosPapadopoulos TY! S'il vous plaît, aidez-moi ici ... je n'ai pas vraiment une connaissance approfondie du sujet. Comment proposeriez-vous que je différencie les marches aléatoires des processus autorégressifs?
Alexis
Volontier. Il existe une grande littérature sur les marches aléatoires, le sujet est très divers. Mais au premier niveau, ce qui distingue une marche aléatoire est que toutes les valeurs passées de chaque étape contribuent avec leur pleine valeur à la valeur actuelle de leur somme (qui est la marche aléatoire) .Dans un processus autorégressif, généralement l'effet du passé s'éteint progressivement. Vous en discutez essentiellement dans votre message Aussi maintenant je relis votre réponse, vous voulez peut-être repenser l'utilisation du mot "population": chaque a une distribution différente, donc dans quel sens appartient à la même population? ytyt,yt+1...
Alecos Papadopoulos
1
@Nemo Vous obtenez un type de comportement spécifique (généralement au fil du temps): le passé détermine entièrement où vous êtes - mais , le chemin de l'évolution n'affecte pas où vous serez ensuite. Comment le processus est arrivé à sa position actuelle n'a pas d'importance pour l'avenir.
Alecos Papadopoulos
1
Une marche aléatoire n'est vraiment pas "similaire à un test de Kolmogorov-Smirnov". Une dérivation de la distribution asymptotique de la statistique du test KS sous l'hypothèse nulle utilise une notion liée à une marche aléatoire. Le point de dessiner cette connexion semble à mon avis rapide être de motiver le développement dans la section suivante (le test GSEA). Je ne suis pas sûr que c'était un bon choix; cela semble vous avoir conduit à la confusion plutôt qu'à vous aider à voir ce qui se passait. Je vous suggère d'essayer de comprendre les promenades aléatoires séparément avant d'essayer de comprendre le lien entre les promenades aléatoires et la GSEA.
Glen_b -Reinstate Monica