Pour être honnête, j'ai lu de nombreux sites Web et réponses concernant cette question, et aucun ne l'a expliquée en termes simples et compréhensibles. Ce que je veux faire, c'est comprendre ce que fait une marche aléatoire et comment elle peut être utilisée pour l'analyse d'enrichissement des ensembles de gènes.
Il y a un article publié ici http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ cependant, je ne pouvais pas vraiment le comprendre.
Quelqu'un peut-il expliquer ce qu'il fait en termes simples?
time-series
biostatistics
bioinformatics
Apprenant
la source
la source
Réponses:
Je vais essayer de répondre à votre première question
Une marche aléatoire est une série de mesures dans lesquelles la valeur à un point donné de la série est la valeur du point précédent de la série plus une certaine quantité aléatoire.
Par exemple, supposons que vous lancez une pièce juste dans une série de lancers, et chaque fois que la pièce monte, vous ajoutez 1 à la valeur précédente de votre variable série, et chaque fois que la pièce arrive pile, vous soustrayez 1 de la valeur précédente. de votre variable série. Si la valeur de départ est 0 et si vous retournez la séquence suivante de lancers de pièces:
La marche aléatoire ,y sur la base de ces valeurs telles que décrites ci-dessus serait:
Donc, la valeur dey est:
La distribution de dépend du temps , ce qui donne des propriétés intéressantes à un échantillon de à différents moments:y t y
La moyenne de n'est pas définie.y Cela peut sembler contre-intuitif, car vous pourriez vous attendre à ce que les têtes et les queues d'une pièce équilibrée soient centrées sur zéro. C'est vrai dans la mesure où cela va, mais zéro n'était qu'une valeur de départ arbitraire de . y Il n'y a donc pas de véritable moyen!
La variance de .y=t À mesure que le temps (le nombre de flips) augmente, la variance augmente également. Par exemple, au premier flip ( ), les valeurs possibles sont ou , et en effet la variance est alors 1. Mais au deuxième flip ( ) les valeurs possibles sont , ou , et la variance est égale à 2. Pour un nombre infini de flips (à , lorsque la plage de toutes les valeurs possibles de va de à ), la variance est infinie.t=1 1 −1 t=2 2 0 −2 t=∞ y −∞ ∞
Ces deux faits font des ravages en essayant de tirer des inférences sur la distribution de (plutôt que pour un donné) étant donné seulement un échantillon lors de l'utilisation des outils de base de l'inférence statistique. (Comment un fini estimation non défini ? Comment un fini estimation ?)y yt y0 y¯ s2y σ2y=∞
Il existe de nombreux types de marches aléatoires et, plus généralement, de processus autogrégressifs (c'est-à-dire toute variable qui dépend en quelque sorte de ses valeurs précédentes). L'exemple ici utilise une simple variable aléatoire de Bernouli (le tirage au sort), mais on pourrait:
Mais ce sont tous les Dickens à essayer d'analyser en utilisant les méthodes de base. C'est pourquoi nous avons des régressions de cointégration et des modèles de correction d'erreurs et d'autres techniques d'analyse de séries chronologiques pour traiter ce type de données (que nous appelons parfois «non intégrées», «à mémoire longue» ou «racine unitaire» entre autres étiquettes). , selon les détails).
L'origine du terme "marche aléatoire" provient d'une paire de très brèves lettres à Nature en 1905.
Références
Pearson, K. (1905). Lettres à l'éditeur: Le problème de la marche aléatoire. Nature , 72 (1865): 294.
Pearson, K. (1905). Lettres à l'éditeur: Le problème de la marche aléatoire. Nature , 72 (1867): 342.
la source