Come verificare se lo "stato precedente" ha influenza sullo "stato successivo" in R


10

Immagina una situazione: abbiamo record storici (20 anni) di tre mine. La presenza di argento aumenta la probabilità di trovare oro nel prossimo anno? Come testare questa domanda?


inserisci qui la descrizione dell'immagine

Ecco alcuni dati di esempio:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)


1
Potresti essere interessato al calcolo delle matrici di transizione .
Andy W,

Ciao @AndyW! Grazie per il commento Conosco il pacchetto di matrici di transizione: makkovchain - markovchainFit (). Posso usare i valori di probabilità dalla matrice di transizione come valori p? Esiste un modo per verificare l'ipotesi: "Esiste una relazione" argento-oro ". (p-value = xx)?
Ladislav Naďo,

1
Le probabilità di transizione di @LisislavNado non possono essere interpretate come valori-p (non ti dicono nulla sul rifiuto di alcun H0), vedi stats.stackexchange.com/questions/31/… per saperne di più sui valori-p.
Tim

1
Vedo un problema con il modo in cui hai estratto i tuoi dati. Considera il tuo scenario "argento: no" e "oro: sì", dovresti anche contare le tue serie consecutive di "oro" poiché soddisfano i criteri logici.

1
Con una cella corretta da 1 a 14, il modello cambia in: Coefficienti: Std Std. Valore z errore Pr (> | z |) (intercetta) -1,2528 0,8018 -1,562 0,118 come fattore (c (0, 1)) 1 0,3655 0,8624 0,424 0,672

Risposte:


4

Il mio miglior tentativo: ... l'uso delle matrici di transizione suggerite da @AndyW non è probabilmente la soluzione che sto cercando (in base al commento di @ Tim). Quindi ho provato un approccio diverso. Ho trovato questo collegamento che tratta di come eseguire la regressione logistica in cui la variabile di risposta y e una variabile di predittore x sono entrambe binarie .

Secondo l'esempio, dovrei creare una tabella 2 × 2 basata sui miei dati:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Come ho estratto i valori: inserisci qui la descrizione dell'immagine

E costruisci un modello:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

È una buona soluzione? Il valore p (0,673) indica che la presenza di argento non aumenta la probabilità di trovare l'oro?


Come hai generato questi bei grafici? Tikz?
Shadowtalker,

Ciao @ssdecontrol! I grafici sono stati fatti a mano in Inkscape.
Ladislav Naďo,

Sì, questa è un'interpretazione decente. Inoltre, se guardi solo le righe del tuo tavolo 2x2, nella riga superiore (argento: sì) hai 9 casi, 2 dei quali avevano l'oro, quindi la probabilità d'argento dell'oro dell'anno prossimo è di 2/9 = 0,222. Nella riga inferiore (argento: no) hai 48 casse, 14 delle quali avevano l'oro l'anno prossimo, quindi nessuna probabilità d'argento dell'oro è 14 / (14 + 34) = 0,292. Alla luce di tutto ciò, sembra che l'argento danneggi le tue possibilità di trovare oro, anche se dai tuoi valori p non "statisticamente significativi".
Gregor Thomas,

Fai attenzione anche alla tua codifica, per iniziare yes = c(2, 14), no = c(7, 34), il che significa che devi mettere Silver: sì prima. Quindi quando fai as.factor(c(0, 1))lo 0 corrisponde all'argento: sì, che è il tuo livello di riferimento e quindi la tua intercettazione. Il valore p di 0.67 corrisponde al piccolo urto positivo che si ottiene nella probabilità di trovare l'oro che si sposta dall'argento: sì all'argento: no.
Gregor Thomas,

Un ultimo commento: si stanno usando matrici di transizione. La tua matrice 2, 7, 14, 34 è una matrice di transizione.
Gregor Thomas,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.