Imaginez une situation: nous avons des enregistrements historiques (20 ans) de trois mines. La présence d'argent augmente-t-elle la probabilité de trouver de l'or l'année prochaine? Comment tester une telle question?
Voici des exemples de données:
mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
"rock","rock","rock","rock","silver","rock","rock",
"rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
"silver","gold","gold","gold","gold","gold","rock",
"silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
"rock","silver","rock","rock","rock","rock","silver",
"gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)
r
time-series
hypothesis-testing
stochastic-processes
Ladislav Naďo
la source
la source
Réponses:
Mon meilleur essai: ... l'utilisation des matrices de transition suggérées par @AndyW n'est probablement pas la solution que je recherche (basée sur le commentaire de @ Tim). J'ai donc essayé une approche différente. J'ai trouvé ce lien qui traite de la façon de faire une régression logistique où la variable de réponse y et une variable prédictive x sont toutes deux binaires .
Selon l'exemple, je devrais créer un tableau 2 × 2 basé sur mes données:
Comment j'ai extrait les valeurs:
Et construisez un modèle:
Est-ce une bonne solution? La valeur de p (0,673) signifie-t-elle que la présence d'argent n'augmente pas la probabilité de trouver de l'or?
la source
yes = c(2, 14), no = c(7, 34)
, ce qui signifie que vous mettez Silver: oui d'abord. Donc quand vous faitesas.factor(c(0, 1))
le 0 correspond à l'argent: oui, qui est votre niveau de référence et donc votre interception. La valeur de 0,67 p correspond à la petite bosse positive que vous obtenez en probabilité de trouver de l'or passant de l'argent: oui à l'argent: non.