Quali sono i presupposti per l'applicazione di un modello di regressione Tobit?


9

La mia (molto basilare) conoscenza del modello di regressione Tobit non proviene da una classe, come preferirei. Invece, ho raccolto informazioni qua e là attraverso diverse ricerche su Internet. La mia ipotesi migliore sulle ipotesi di regressione troncata è che sono molto simili alle ipotesi dei minimi quadrati ordinari (OLS). Non ho idea se sia corretto, però.

Da qui la mia domanda: quali sono i presupposti che dovrei verificare quando eseguo la regressione di Tobia?

Nota: la forma originale di questa domanda si riferiva alla regressione troncata, che non era il modello che stavo usando o chiedendo. Ho corretto la domanda.


1
Non dovresti usare la regressione troncata solo perché hai dati distorti o limitati. È specifico per le situazioni in cui sono possibili valori al di sotto di una soglia (ad es. Valori negativi), ma per qualche motivo non sarebbero osservabili. È questa la situazione che hai?
Aniko,

@Aniko, i valori negativi della variabile dipendente non hanno davvero senso (significherebbe essere pagati per ricevere un servizio), ma ho sentito che Wooldridge (in Econometric Analysis of Cross Section and Panel Data , 2002) aveva raccomandato di troncare o modelli di regressione censurati invece di OLS quando eppure è una variabile casuale continua su valori positivi. YP(Y=0)>0Y
Firefeather il

Tremendo sbaglio; Ho capito che intendevo dire regressione di Tobia per tutto il tempo, non regressione troncata . Ho appena cambiato la domanda per riflettere questo errore.
Firefeather,

Il riferimento Wooldridge è ancora il riferimento corretto; cioè, si riferisce alla regressione di Tobia.
Firefeather,

Aniko ha ragione, quel tobit potrebbe non essere la scelta migliore. Dai

Risposte:


6

Se cerchiamo una risposta semplice, l'estratto del libro di Wooldridge (pagina 533) è molto appropriato:

... sia eteroschedasticità e risultato nonnormality nel tobit stimatore β essere incoerente per β . Questa incoerenza si verifica perché la densità derivata di y data x dipende in modo cruciale da y | x N o r m a l ( x β , σ 2 ) . Questa non-affidabilità dello stimatore Tobit mostra che la censura dei dati può essere molto costosa: in assenza di censura ( y = y ) β potrebbe essere costantemente stimata in Eβ^βyxy|xNormal(xβ,σ2)y=yβ [o anche E ( x u ) = 0 ].E(u|x)=0E(xu)=0

Le notazioni in questo estratto provengono dal modello Tobit:

y

y=xβ+u,u|xN(0,σ2)y=max(y,0)
yx

Riassumendo la differenza tra i minimi quadrati e la regressione di Tobia è l'assunto inerente alla normalità in quest'ultimo.

Inoltre ho sempre pensato che l' articolo originale di Amemyia fosse abbastanza bello nel gettare le basi teoriche della regressione di Tobia.


Wow! Grazie per aver trovato un riferimento visualizzabile: non avevo pensato di cercare su Google Libri quando cercavo una copia del libro di Wooldridge.
Firefeather,

4

Per fare eco al commento di Aniko: il presupposto principale è l'esistenza del troncamento. Questo non è lo stesso presupposto delle altre due possibilità che il tuo post mi suggerisce: limitatezza e selezione del campione.

Se hai fondamentalmente variabile dipendente limitata anziché troncata, è possibile passare a un modello di modello lineare generalizzato con una delle distribuzioni (meno scelte) per Y, ad esempio log-normale, gamma, esponenziale, ecc. Che rispetti che limite inferiore.

In alternativa, potresti chiederti se pensi che il processo che genera le zero osservazioni nel tuo modello sia lo stesso di quello che genera valori strettamente positivi - i prezzi nella tua applicazione, credo. In caso contrario, qualcosa della classe di potrebbe essere appropriato modelli di selezione campioni (ad esempio modelli di Heckman). In tal caso, ti troverai nella situazione di specificare un modello di disponibilità a pagare qualsiasi prezzo e un altro modello di quale prezzo pagherebbero i tuoi soggetti se volessero pagare qualcosa.

In breve, probabilmente vorrai rivedere la differenza tra assumere variabili troncate, censurate, limitate e campionate selezionate. Quale vuoi verrà dai dettagli della tua domanda. Una volta effettuata la prima ipotesi più importante, puoi determinare più facilmente se ti piacciono le ipotesi specifiche di qualsiasi modello nella classe scelta. Alcuni dei modelli di selezione del campione hanno ipotesi che sono piuttosto difficili da controllare ...


3

@Firefeather: i tuoi dati contengono (e possono contenere solo davvero) solo valori positivi? In tal caso, modellarlo utilizzando un modello lineare generalizzato con errore gamma e collegamento log. Se contiene zeri, è possibile prendere in considerazione due fasi (regressione logistica per probabilità di zero e regressione gamma per i valori positivi). Quest'ultimo scenario può anche essere modellato come una singola regressione usando una gamma gonfiata zero. Alcune grandi spiegazioni di ciò sono state fornite in un elenco SAS alcuni anni fa. Inizia qui se sei interessato e cerca follow-up. testo del link

Potrebbe aiutarti a indirizzarti in un'altra direzione se la regressione troncata risulta non plausibile.


2

Come altri hanno già menzionato qui, l'applicazione principale della regressione tobit è quella in cui vi è la censura dei dati. Tobit è ampiamente usato in congiunzione con Data Envelopment Analysis (DEA) e dall'economista. In DEA, il punteggio di efficienza è compreso tra 0 e 1, il che significa che la variabile dipendente viene censurata a 0 da sinistra e 1 da destra. Pertanto, l'applicazione della regressione lineare (OLS) non è possibile.

Tobia è una combinazione di regressione probit e troncata. Prestare attenzione nel differenziare la censura e il troncamento:

  • Censura: quando le osservazioni limite sono nel campione. I valori delle variabili dipendenti raggiungono un limite a sinistra o a destra.
  • Troncamento: osservazione in cui un certo intervallo di valori dipendenti non è incluso nello studio. Ad esempio, solo valori positivi. Il troncamento ha una maggiore perdita di informazioni rispetto alla censura.

Tobia = Probit + Regressione di troncamento

Il modello Tobit assume la normalità come fa il modello probit.

passi:

  1. Il modello Probit decide se la variabile dipendente è 0 o 1. Se la variabile dipendente è 1, allora di quanto (assumendo la censura a 0) .

    (Discreet decision)P(y>0)=Φ(xβ)
  2. (Continuous decision)E(yy>0)=xβ+σλ(xβσ)

Il coefficiente è lo stesso per entrambi i modelli decisionali. è il termine di correzione per regolare i valori censurati (zeri). σ λ ( xβσλ(xβσ)

Controlla anche il modello di Cragg in cui puoi usare diversi in ogni passaggio.β


Benvenuto nel sito, @Amarnayak. Ho modificato il tuo post per utilizzare la formattazione di tipo . Assicurati che dica ancora quello che vuoi. LATEX
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.