Econometria: l'elasticità è significativa nella mia o in qualsiasi regressione?


13

Qualche mese fa sono stato internato in questa organizzazione; e, come regalo d'addio, ho deciso di trascorrere la mia ultima settimana, con tutto il tempo libero che avevo, per studiare i fattori che influenzano gli stipendi degli insegnanti. Un problema che ho riscontrato con gli stipendi degli insegnanti era che la distribuzione per lo stato dato era distorta. Ho avuto molte osservazioni che si aggrappavano all'estremità inferiore dello spettro salariale. Ho provato a risolverlo incorporando un indice dei salari comparabili nella mia variabile dipendente (salari degli insegnanti), ma i risultati che ho trovato erano completamente obsoleti per lo scopo del mio progetto. Ho invece deciso di registrare la mia variabile dipendente. Questo è stato bello perché ora i miei salari avevano una distribuzione normale ed era semplicemente perfetto nell'istogramma. Quando ho iniziato il test, sono arrivato al punto in cui ero rimasto con un'ultima variabile indipendente, dichiarazioni dei redditi da proprietà. Il problema con i miei salari normativi era evidente anche nelle mie osservazioni sulla dichiarazione dei redditi da proprietà. Ho avuto un'enorme inclinazione dei numeri di dichiarazione dei redditi da proprietà verso l'estremità inferiore dello spettro. Quindi, ho registrato anche questa variabile e ha comunque superato il test di ipotesi nulla.

Non sono sicuro che questo sia esattamente corretto, ma confrontando la modifica di una variabile registrata con un'altra variabile registrata mi ha dato l'elasticità. Supponendo che ciò sia corretto, la mia equazione di regressione (qualcosa come LogWages = B0 + B1 (LogPropertyTaxReturns)) mostra l'elasticità tra le due variabili. Questo è significativo però? Se il mio obiettivo fosse vedere quale variabile ha influenzato maggiormente gli stipendi degli insegnanti in una determinata contea del mio stato, allora sta mostrando utile l'elasticità tra le due variabili? Vogliamo aumentare le contee con i salari degli insegnanti più bassi più in alto per aumentare il loro tenore di vita, ma temo di aver estrapolato così lontano dalle osservazioni reali che la mia equazione di regressione conclusiva non ha senso.

Modifica: una delle mie paure più grandi è che avrei dovuto usare un modello non lineare per mostrare la relazione. Sento che forzare la variabile dipendente e quella indipendente a cooperare in questa regressione lineare è in qualche modo fuorviante.


1
È assolutamente significativo. Guarda la definizione di elasticità. Fondamentalmente hai informazioni sulla direzione della relazione tra Wages e PropertyTaxReturns. Inoltre, hai una stima della relazione. Poiché si tratta di Log-Log, i salari cambieranno di B1 percentuali per ogni variazione percentuale della dichiarazione dei redditi di proprietà. Potresti fare un'analisi delle serie temporali per confermarlo. In realtà, basta solo rappresentare graficamente i salari e la dichiarazione dei redditi da proprietà nel tempo sarebbe sufficiente per vedere qual è la relazione. Questo è un modo di base che non tiene conto delle variabili nascoste, ecc.
Koba,

@Koba Grazie per aver commentato così in fretta. Il problema non è che l'elasticità cambia lungo la curva? Il mio più grande rammarico è che avrei potuto costringere il modello ad essere lineare, costringendo l'elasticità a essere abbastanza stabile. Ripensandoci, sarebbe stato effettivamente meglio avere un modello non lineare per riflettere questa inclinazione di cui stavo parlando.
rosenjcb,

Non c'è nulla di sbagliato nel trasformare le variabili usando log, radice quadrata, reciprocità o altri metodi. Non stai forzando nulla. Utilizzare le trasformazioni per trovare la relazione lineare tra le variabili. A volte è facile come usare semplicemente y = b0 + b1 * x. Altre volte le variabili sono linearmente correlate in modo più complicato come ad esempio log (y) = b0 + b1 * (1 / x). L'ultima funzione potrebbe darti una buona relazione lineare, ma è più difficile da interpretare, quindi meno trasformazioni puoi usare, meglio è.
Koba,

La funzione log-log è piuttosto semplice log (y) = b0 + b1 * log (x). B1 è precisamente la variazione percentuale in y per una variazione percentuale in x nell'analisi della sezione trasversale. Ancora una volta, se hai questi dati per un certo periodo di tempo, puoi semplicemente rappresentarli graficamente per vedere la relazione.
Koba,

Ho già registrato variabili e fatto altre trasformazioni per i miei modelli di regressione. Ero solo preoccupato che l'elasticità facesse finta di incontrarsi. Tuttavia, ripensandoci, il modello era lineare, aveva solo il problema di avere variabili dipendenti e indipendenti con distribuzioni distorte.
rosenjcb,

Risposte:


12

La risposta alla domanda è sì, è davvero significativa (almeno matematicamente parlando). Se si stima l'equazione lineare

W=β0+β1PTR,

poi , il che significa che rappresenta la variazione marginale sopra . Ora, se stimateβ1=WPTRβ1PTRW

log(W)=β0+β1log(PTR),

quindi , che è la definizione stessa di elasticità.β1=WPTRPTRW

In linea generale, le trasformazioni lineari influenzano solo l'interpretazione data ai coefficienti, ma la validità della regressione stessa (in termini economici generali) è data dalle ipotesi del modello e dai fenomeni economici che vengono analizzati.


8

Come la gente ha detto nei commenti, il log-log è comunemente usato. Equivale a stimare un modello di elasticità costante , che è una forma funzionale comunemente usata all'interno dell'economia. Una volta che si prende i registri, questo diventa . Puoi leggere di più su questo qui .Y=αXβlnY=lnα+βlnX

Immagino che la tua domanda sia se usare o meno questo modulo funzionale abbia senso nel tuo modello particolare. È difficile da dire. Come con qualsiasi normale regressione lineare, stai assumendo un'ipotesi sulla forma funzionale. Puoi almeno pensarlo come un'approssimazione lineare che ha più senso dopo la trasformazione del log-log.


7

Bene, gli altri intervistati hanno coperto abbastanza bene la logica dietro una regressione log-log, quindi aggiungerò solo alcuni consigli pratici. Se si desidera verificare se la specifica è ragionevole e il problema è l'assunzione di una elasticità costante, provare a dividere il campione in gruppi in base ai percentili di e ricalcolare e . Quindi vedi quanto differiscono. Puoi persino farlo usando i manichini e i termini di interazione per ciascuno dei percentili, quindi usa un test per determinare il significato congiunto dei termini di interazione. In altre parole: doveXαβF

logyio=α+βlogXio+Σj=2Sγjχj+λjχjlogXio
χjè il tuo manichino percentile. Quindi verifica se i 'e ' sono congiuntamente significativi. Questo non è affatto formale , ma può darti un'idea approssimativa di quanto sia ragionevole avere un'elasticità costante.γλ

Si noti che come rappresentazione della "vera" decisione sottostante, tutte le trasformazioni che provocano una regressione lineare sono errate. In effetti, tutti i modelli saranno sbagliati. La domanda è davvero: la statistica che hai ottenuto da questo modello è utile al tuo problema ? Se il tuo studio è focalizzato sulla determinazione di un modello sottostante, è questo un momento che ti dice qualcosa di interessante su quel modello più profondo? Se sei più orientato alle politiche, un'approssimazione con elasticità costante ti avvicinerà abbastanza alla verità che ulteriori miglioramenti sono irrilevanti? O sono domande estremamente difficili a cui rispondere come osservatore esterno. Ma se l'unica alternativa di cui ti preoccupi è l'elasticità variabile, il tipo di test che ho descritto sopra può darti un po 'di tranquillità.


4

Le altre risposte hanno riguardato i problemi principali, vorrei rispondere alla "Modifica" effettuata dall'OP nella domanda:

Modifica: una delle mie paure più grandi è che avrei dovuto usare un modello non lineare per mostrare la relazione. Sento che forzare la variabile dipendente e quella indipendente a cooperare in questa regressione lineare è in qualche modo fuorviante.

Tendiamo a dimenticare che "trasformare una variabile" porta a una nuova variabile , il cui comportamento può essere totalmente diverso da quello "originale". L'esempio più semplice è quello di confrontare i grafici di una variabile e il suo quadrato.

Quindi, considerando i logaritmi naturali delle tue variabili, non esamini più la relazione tra loro , ma una relazione tra alcune loro funzioni.
È una fortuna che il concetto matematico di "logaritmo" possa essere collegato al concetto di "elasticità", che descrive una relazione tra variazioni percentuali, che è qualcosa che comprendiamo da un punto di vista economico e che possiamo interpretare e utilizzare in modo significativo.

Se si può ragionevolmente dire che le variabili mostrano una "relazione lineare nei logaritmi", significa che i loro livelli (cioè le variabili effettive) hanno una relazione non lineare:

lnyun'+BlnXyeun'+XB

Quindi perché non stimare un modello non lineare?
In linea di principio (matematica), non c'è motivo per cui no. Alcune questioni pratiche sono:

1) Esistono troppe forme di relazioni non lineari, esiste solo una relazione lineare (strutturalmente parlando). Si tratta di "costi di ricerca" per la specifica più adatta.

2) La relazione non lineare ottenuta potrebbe non avere una chiara spiegazione economica . Perché questo è un problema? Perché qui non stiamo scoprendo "leggi della natura", invariate nel tempo e nello spazio. Stiamo approssimando un fenomeno sociale. Avere un'approssimazione che, inoltre, può essere presentata solo come una formula matematica, senza un ragionamento economico che la convalida e la supporta, rende il risultato molto scarno.

3) La stima non lineare è meno stabile, per quanto riguarda la meccanica dell'algoritmo di stima.


3

Direi che il tuo modello in questo caso non sembra significativo se il tuo " obiettivo era vedere quale variabile ha influenzato maggiormente gli stipendi degli insegnanti in una determinata contea del mio stato ". Hai appena mostrato qual è la correlazione tra (i registri di) i salari e le dichiarazioni dei redditi da proprietà. Dovresti almeno usare una regressione multipla.

Naturalmente, potresti continuare e sviluppare una strategia di identificazione a tutti gli effetti, con gli strumenti metodologici appropriati al fine di stimare l'intensità di ogni effetto causale e trovare il più grande ... In realtà, molto probabilmente non sarai in grado per farlo data la complessità di tale compito. È solo un continuum di raffinatezze e sei vicino al modello più rozzo possibile usato per spiegare i salari, molto lontano da ciò che considererei le approssimazioni accettabili di una risposta alla domanda implicita nel tuo obiettivo. Dovresti provare a chiedere l'aiuto di un econometrico.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.