Regressione lineare con una variabile dipendente che è un rapporto


10

Sto facendo regressioni lineari in cui la variabile dipendente è un rapporto che può variare da 0,01 a 100.

Va bene prendere il registro della variabile dipendente e la regressione su quello? Sto abbinando i risultati di uno studio ed è quello che hanno fatto.

Qual è la differenza tra prendere il registro e usare il rapporto così com'è?


Sto cercando una valutazione dei prezzi delle case. La mia variabile indipendente è il prezzo della casa valutato diviso per il prezzo di vendita. Le mie variabili dipendenti sono diverse categorie di razza (percentuale in bianco, nero, ispanico e asiatico) e reddito familiare medio. Sto scoprendo che i trattati censuari con una percentuale maggiore di neri hanno una valutazione più alta rispetto al rapporto dei prezzi di vendita rispetto ad altre aree.
Aaron Kreider,

Perché non usi la regressione logistica? È possibile definire il rapporto in quanto la variabile dipendente è costituita da numerosi pacchetti statistici.
statnoobie1,

1
La regressione logistica è in genere per valori binari o proporzioni (tra 0 e 1). Non è applicabile qui poiché il rapporto può superare 1.
Max Ghenis

Risposte:


9

Quando prendi il registro del rapporto, tieni presente che cos'è: L'utilizzo di questo valore come variabile dipendente ha senso nel tuo problema?log(ab)=log(a)log(b)

Ora, per quanto riguarda l'utilizzo del rapporto non elaborato, questo può essere problematico. Kronmal 1993 sostiene che una regressione con un rapporto come variabile dipendente: che può essere descritta come è un sottomodello di
YZ=α0+αXX+ϵ

Y=Z1nα0+ZXαX+Z1ϵ

Y=β0+βXX+Z1nα0+ZXαX+Z1ϵ

aka ...

  • Registra il numeratore in base alle variabili indipendenti originali, denominatore e denominatore per le variabili originali
  • Regressione del peso per denominatore (inverso)

Solo nel caso in cui e fossero zero, il modello di regressione originale sarebbe valido.β0βX

Caveat - Io non sono convinto di avere una comprensione completa di rapporti sia .


Stai assumendo una Z fissa? Ho 27.000 casi (ovvero proprietà) e Y (prezzo di valutazione) e Z (prezzo di vendita) differiscono per ciascuno.
Aaron Kreider,

No, Z è una matrice diagonale nxn, con le diagonali come prezzo di vendita. La mia notazione nella prima equazione potrebbe essere confusa poiché non utilizza la notazione matriciale. sarebbe in linea con il resto. Z1Y=α0+αXX+ϵ
Affine del

Ok. Ho esaminato gli approcci suggeriti nella tua domanda collegata e hanno senso. Non ne so abbastanza per consigliarli in un modo o nell'altro, ma se qualcuno conferma i tuoi suggerimenti di quanto potrei provarli.
Aaron Kreider,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.