J'ai une expérience temporelle qui suit 8 groupes de traitement de 12 poissons pendant 24 heures avec des observations faites à 5 secondes d'intervalle. Parmi les mesures effectuées figure la distance parcourue par chaque poisson (en mm) entre les observations. Les 24 heures sont divisées en 1 période sombre et 1 période claire.
Voici un graphique des mouvements des 12 poissons individuels du groupe de traitement H pendant la première heure de la période sombre:
Vous pouvez voir que certains poissons ont de longues périodes d'inactivité, certains de courtes périodes et certains n'en ont pas pendant cette fenêtre particulière . Je dois combiner les données des 12 poissons du groupe de traitement de manière à identifier la longueur et la fréquence des périodes de repos pendant toute la période d'obscurité et la période d'éclairage. Je dois le faire pour chaque groupe de traitement. Ensuite, je dois comparer les différences entre les longueurs et les fréquences de leurs périodes de repos.
Je ne suis pas une fille de statistiques et je suis complètement en mer. Le problème ressemble à l'alignement de séquence pour moi (mon expérience en bio-informatique), donc je pense aux modèles de Markov cachés, mais cela peut être loin de la base. Quelqu'un pourrait-il suggérer une bonne approche à ce problème et peut-être un petit exemple en R?
Merci!
la source
Réponses:
Je pense qu'une analyse basée sur HMM pourrait vous être utile. Puisque vous savez que vous recherchez une distinction entre le repos et le mouvement, vous pouvez simplement postuler un modèle à 2 états. Pour les HMM, vous devez spécifier la probabilité d'émission pour chaque état. Mon premier essai serait d'utiliser une exponentielle (ou un gamma?) Pour la phase de repos (car elle est limitée par zéro par le bas et une distribution normale pour l'autre état (vous devez définir les paramètres initiaux sur une valeur raisonnable). Vous peut ensuite calculer la distribution des états postérieurs ainsi que les estimations du maximum de vraisemblance pour vos paramètres. La séquence des états postérieurs peut vous donner les durées estimées des périodes de repos et d'activité (il suffit de compter le nombre d'états successifs). période sombre / claire comme covariable dans le modèle.
Ce http://cran.r-project.org/web/packages/depmixS4/index.html est un excellent package pour les HMM. Cette vignette http://cran.r-project.org/web/packages/depmixS4/vignettes/depmixS4.pdf contient également des informations très utiles sur son application et l'utilisation des contraintes et covariables avec les HMM.
Un problème que je vois, c'est que vous avez plusieurs poissons. Vous devriez commencer par installer un HMM pour chaque poisson séparément. Peut-être pourriez-vous combiner du poisson si vous pouviez en quelque sorte "normaliser" l'activité de telle sorte qu'ils pourraient produire les mêmes paramètres de probabilité d'émission. Ou vous pouvez utiliser le nombre de poissons comme covariable.
Un exemple de code:
mais il existe de très nombreuses possibilités, consultez les liens ci-dessus!
Bonne chance pour votre projet!
la source