Comment tester si «l'état précédent» a une influence sur «l'état suivant» dans R

10

Imaginez une situation: nous avons des enregistrements historiques (20 ans) de trois mines. La présence d'argent augmente-t-elle la probabilité de trouver de l'or l'année prochaine? Comment tester une telle question?


entrez la description de l'image ici

Voici des exemples de données:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)

Ladislav Naďo
la source
1
Vous pourriez être intéressé par le calcul des matrices de transition .
Andy W
Salut @AndyW! Merci pour le commentaire. Je connais le paquet de matrices de transition: makkovchain - markovchainFit (). Puis-je utiliser les valeurs de probabilité de la matrice de transition comme valeurs p? Existe-t-il un moyen de tester l'hypothèse: "Il existe une relation" argent-or "". (valeur p = xx)?
Ladislav Naďo
1
Les probabilités de transition @LadislavNado ne peuvent pas être interprétées comme des valeurs p (elles ne vous disent rien sur le rejet de tout H0), voir stats.stackexchange.com/questions/31/… pour en savoir plus sur les valeurs p.
Tim
1
Je vois un problème avec la façon dont vous avez extrait vos données. Considérez votre scénario "argent: non" et "or: oui", vous devriez également compter vos séries consécutives "d'or" car cela répond aux critères logiques.
1
Une cellule étant corrigée de 1 à 14, le modèle devient: Coefficients: Estimation Std. Erreur valeur z Pr (> | z |) (Interception) -1,2528 0,8018 -1,562 0,118 as.factor (c (0, 1)) 1 0,3655 0,8624 0,424 0,672

Réponses:

4

Mon meilleur essai: ... l'utilisation des matrices de transition suggérées par @AndyW n'est probablement pas la solution que je recherche (basée sur le commentaire de @ Tim). J'ai donc essayé une approche différente. J'ai trouvé ce lien qui traite de la façon de faire une régression logistique où la variable de réponse y et une variable prédictive x sont toutes deux binaires .

Selon l'exemple, je devrais créer un tableau 2 × 2 basé sur mes données:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Comment j'ai extrait les valeurs: entrez la description de l'image ici

Et construisez un modèle:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

Est-ce une bonne solution? La valeur de p (0,673) signifie-t-elle que la présence d'argent n'augmente pas la probabilité de trouver de l'or?

Ladislav Naďo
la source
Comment avez-vous généré ces jolis graphiques? Tikz?
shadowtalker
Salut @ssdecontrol! Les graphiques ont été créés à la main dans Inkscape.
Ladislav Naďo, le
Oui, c'est une interprétation décente. De plus, si vous regardez simplement les rangées de votre tableau 2x2, sur la rangée du haut (argent: oui), vous avez 9 caisses, dont 2 d'or, donc étant donné la probabilité d'argent d'or l'année prochaine est de 2/9 = 0,222. Sur la rangée du bas (argent: non), vous avez 48 cas, dont 14 avaient de l'or l'année prochaine, donc sans probabilité d'argent, l'or est de 14 / (14 + 34) = 0,292. Compte tenu de tout cela, l'argent semble nuire à vos chances de trouver de l'or, bien que vos valeurs de p ne soient pas "statistiquement significatives".
Gregor Thomas
Faites également attention à votre codage, vous commencez par yes = c(2, 14), no = c(7, 34), ce qui signifie que vous mettez Silver: oui d'abord. Donc quand vous faites as.factor(c(0, 1))le 0 correspond à l'argent: oui, qui est votre niveau de référence et donc votre interception. La valeur de 0,67 p correspond à la petite bosse positive que vous obtenez en probabilité de trouver de l'or passant de l'argent: oui à l'argent: non.
Gregor Thomas
Un dernier commentaire: vous sont en utilisant des matrices de transition. Votre matrice 2, 7, 14, 34 est une matrice de transition.
Gregor Thomas