Come posso interpretare un modello probit in Stata?


13

Non sono sicuro di come interpretare questa regressione probit che ho eseguito su Stata. I dati sono in fase di approvazione del prestito e il bianco è una variabile fittizia che = 1 se una persona era bianca e = 0 se la persona non lo era. Qualsiasi aiuto su come leggere questo sarebbe molto apprezzato. Quello che sto cercando principalmente è come trovare la probabilità stimata di approvazione del prestito sia per i bianchi che per i non bianchi. Qualcuno può anche aiutarmi con il testo qui e come renderlo normale ?? Mi dispiace non so come fare.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

per il bianco variabile:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

per la costante:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  

Risposte:


44

In generale, non è possibile interpretare i coefficienti dall'output di una regressione probit (non almeno in modo standard). È necessario interpretare gli effetti marginali dei regressori, ovvero quanto cambia la probabilità (condizionale) della variabile di risultato quando si cambia il valore di un regressore, mantenendo costanti tutti gli altri regressori ad alcuni valori. Ciò è diverso dal caso di regressione lineare in cui si interpretano direttamente i coefficienti stimati. Questo perché nel caso della regressione lineare, i coefficienti di regressione sono gli effetti marginali .

Nella regressione probit, è necessario un ulteriore passaggio di calcolo per ottenere gli effetti marginali dopo aver calcolato l'adattamento della regressione probit.

Modelli di regressione lineare e probit

  • Regressione probit: ricorda che nel modello probit stai modellando la probabilità (condizionale) di un risultato "riuscito", ovvero , P [ Y i = 1 X 1 i , , X K i ; β 0 , , β K ] = Φ ( β 0 + K k = 1 β k X k i ) ( Yio=1

    P[Yio=1|X1io,...,XKio;β0,...,βK]=Φ(β0+ΣK=1KβKXKio)
    dove è la funzione di distribuzione cumulativa della distribuzione normale standard. Questo in sostanza dice che, in base ai regressori, la probabilità che la variabile di risultato, Y iΦ()Yio è 1, è una certa funzione di una combinazione lineare dei regressori.
  • Regressione lineare : confronta questo con il modello di regressione lineare, dove

E(Yio|X1io,...,XKio;β0,...,βK)=β0+ΣK=1KβKXKio

Effetti marginali

A parte il modello di regressione lineare, i coefficienti raramente hanno un'interpretazione diretta. In genere siamo interessati agli effetti del ceteris paribus delle modifiche nei regressori che incidono sulle caratteristiche della variabile di risultato. Questa è l'idea che misura gli effetti marginali.

  • Regressione lineare : ora vorrei sapere quanto si muove la media della variabile di risultato quando sposto uno dei regressori

E(Yio|X1io,...,XKio;β0,...,βK)XKio=βK

K

  • Regressione probit: Tuttavia, è facile vedere che questo non è il caso della regressione probit

P[Yio=1|X1io,...,XKio;β0,...,βK]XKio=βKφ(β0+ΣK=1KβKXKio)
φ() è la normale funzione di densità di probabilità normale.

Come calcolare questa quantità e quali sono le scelte degli altri regressori che dovrebbero inserire questa formula? Per fortuna, Stata fornisce questo calcolo dopo una regressione probit e fornisce alcune impostazioni predefinite delle scelte degli altri regressori (non esiste un accordo universale su queste impostazioni predefinite).

Regressori discreti

Si noti che gran parte di quanto sopra si applica al caso dei regressori continui, poiché abbiamo utilizzato il calcolo. Nel caso di regressori discreti, è necessario utilizzare le modifiche discrete. Quindi, ad esempio, il cambiamento discreto in un regressoreXKio che prende i valori {0,1} è

ΔXKioP[Yio=1|X1io,...,XKio;β0,...,βK]=βKφ(β0+Σl=1K-1βlXlio+βK+Σl=K+1KβlXlio)-βKφ(β0+Σl=1K-1βlXlio+Σl=K+1KβlXlio)

Calcolo degli effetti marginali in Stata

Regressione probit: ecco un esempio di calcolo degli effetti marginali dopo una regressione probit in Stata.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

Ecco l'output che otterrai dal marginscomando

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

Questo può essere interpretato, ad esempio, che una unità cambia nella agevariabile, aumenta la probabilità dello stato del sindacato di 0,003442. Allo stesso modo, essendo da sud, diminuisce la probabilità di status sindacale di 0,1054928

Regressione lineare : come controllo finale, possiamo confermare che gli effetti marginali nel modello di regressione lineare sono gli stessi dei coefficienti di regressione (con una piccola torsione). Eseguendo la seguente regressione e calcolando gli effetti marginali dopo

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

ti restituisce solo i coefficienti di regressione. Si noti il ​​fatto interessante che Stata calcola l' effetto marginale netto di un regressore includendo l'effetto attraverso i termini quadratici se inclusi nel modello.

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------

Penso che la tua espressione per ΔXKper il caso del regressore discreto è sbagliato. Stai prendendo la differenza di derivato diP[Y=1], ma dovrebbe essere la differenza di P[Y=1]. Dovrebbe essere solo il secondo termine di RHS, ma senza il segno negativo.
Ravi,

1

Inoltre, e più semplicemente, il coefficiente in una regressione probit può essere interpretato come "un aumento di un'unità di età corrisponde a un βun'geaumento del punteggio z per probabilità di essere in unione "( vedi link ).

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

Quindi fa

predict yhat

E vedrai che per obs 1, il valore adattato è equivalente a βun'ge*20+βgrun'de*12+βconS. Inseriscilo nella normal()funzione per restituire la probabilità corrispondente:

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

Pertanto, un aumento di un'unità di età corrisponde aβun'ge aumento del punteggio z della probabilità di essere nell'unione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.