Modellazione dei prezzi di affitto - quale metodo di interpolazione usare?


13

Ho un set di dati nazionale di circa 1,4 milioni di famiglie. Lì ho informazioni su affitto, dimensioni (numero di camere e m2) e alcune caratteristiche aggiuntive di ogni famiglia.

Vorrei utilizzare questi dati per creare una superficie dei prezzi degli affitti per l'intero paese e utilizzare queste informazioni come proxy per la stima dei valori di circa 1,5 milioni di famiglie che sono possedute o che non dispongono di informazioni sull'affitto.

Un paio di domande qui:

Tale approccio è appropriato per questo tipo di problema?

Quale metodo di interpolazione sarebbe più adatto da usare qui?

Inoltre, sarebbe possibile prendere in considerazione informazioni, ad esempio le dimensioni della famiglia?

Sono su ArcGIS 9.3 con licenza ArcInfo.


1
Sembra che i sistemi di Computer Aided Mass Appraisal (CAMA) dovrebbero fare qualcosa di simile. Mi chiedo come lo gestiscono. en.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Kirk Kuykendall

Risposte:


10

L'idea è buona, ma l'implementazione proposta potrebbe essere troppo semplicistica per essere credibile. Gli affitti sono di proprietà dei sistemi economici. Oltre ad essere influenzati dall'ubicazione, sono collegati ad altre variabili economiche in modi importanti: stato dell'economia locale (e nazionale), prezzi delle abitazioni locali, disponibilità di capitale, tassi di occupazione, ecc. Per fare un buon lavoro è necessario un modello econometrico . Potrebbe trarre vantaggio dall'avere alcuni termini di ritardo spaziale , ma prima di considerare tali complicazioni è necessario includere molte di queste covariate economiche.

Detto questo, la tua capacità di successo dipende dalle relazioni tra i dati che hai e gli affitti che desideri prevedere. Se i tuoi dati sono un campione rappresentativo di tutto il paese e sono geograficamente dispersi - pensa alle case come uvetta su un cookie e hai dati su ogni altra uva passa nel cookie - allora potrebbe essere sufficiente un modello relativamente semplice. Se i tuoi dati sono geograficamente focalizzati - forse hai informazioni sull'uvetta sul lato destro del cookie e vuoi fare previsioni per l'uvetta sul lato sinistro - il problema è più difficile.

Un buon punto di partenza sarebbe quello di adattare un modello econometrico lineare convenzionale degli affitti alle caratteristiche delle famiglie e alle caratteristiche spaziali lorde (come le politiche fiscali statali o di contea), calcolare i residui e iniziare a esplorare i residui spazialmente (usando la variografia , i smooths spaziali del kernel , ecc.) per acquisire gli effetti geografici.

Un apposito software è disponibile come add-on per R .


@whubber Il link al documento che descrive la variografia sembra essere morto. C'è la possibilità di aggiornarlo?
Radek,

1
Grazie @radek. È sorprendentemente difficile trovare un'esposizione di variografia sul Web che sia introduttiva ma accurata e non sia solo un manuale del software. Ho scoperto una recente tesi di dottorato che, a giudicare dal suo abstract e dalla sua introduzione, sembra essere chiara e approfondita e parte da un punto relativamente elementare.
whuber

7

Come introduzione molto delicata agli argomenti sulla regressione spaziale, consiglio vivamente di consultare il manuale di lavoro di GeoDa (i capitoli da 22 a 25 saranno di grande interesse). Anche se non si desidera utilizzare il software, è una panoramica molto completa della regressione spaziale.

Le funzioni di regressione integrate in ArcMap gestiranno così tanti dati (non che nessun software avrebbe un momento difficile con così tanti punti?)


3
(+1) 1,4 milioni di punti non sono un problema per la regressione. (Lo sforzo negli algoritmi dei minimi quadrati, ad esempio, è in genere proporzionale al cubo del numero di variabili. L' impostazione delle equazioni richiede solo una scansione rapida attraverso il set di dati.) Il vero problema è che 1,4 milioni di casi avranno un ricco e struttura dettagliata: una buona analisi sarebbe estremamente laboriosa. (Questo set di dati potrebbe generare un sacco di tesi di dottorato in economia, ne sono sicuro.) Il trucco quindi è fare tutto il lavoro necessario per ottenere risposte sufficientemente accurate e difendibili per il compito da svolgere.
whuber

3

Ho visto un lavoro simile fatto per i prezzi delle case usando la modellazione edonica. Consulta http://scholar.google.com/scholar?hl=it&q=hedonic+price+geography per esempi.


2
(+1) Concordo sul fatto che la letteratura sui modelli edonici dei prezzi delle case sono ampiamente applicabili a questa domanda. Ho riformulato dal suggerirlo, anche se come individuo che non ha familiarità con la regressione può trovare scoraggiante il lavoro di tutti quegli econometrici (lo so, a volte lo faccio!) Teoria saggia, anche se sarebbe una buona letteratura da controllare, specialmente per le covariate di interesse.
Andy W,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.