Valori null nell'analisi di regressione ponderata geograficamente


12

Alcune delle mie variabili esplicative hanno alcuni valori nulli per alcuni poligoni.

Le analisi di regressione ponderate geograficamente possono gestirle o devo rimuovere l'intero poligono e tutti i dati (variabili dipendenti e indipendenti per quel particolare poligono)?


Cosa rappresentano questi null? Che un valore non è applicabile o che esiste ma è sconosciuto? Se quest'ultimo, perché è sconosciuto? (La preoccupazione principale è se la ragione per cui un valore è sconosciuto è in qualche modo correlata al valore stesso; ad esempio, se stai studiando idrologia e usando la copertura del suolo come variabile esplicativa, quindi se la copertura del terreno è sconosciuta a causa di inondazioni, questa è un'informazione importante e significa molto più di un semplice valore mancante.)
whuber

1
Grazie whuber, alcuni dei null rappresentano dati che sono stati omessi per la riservatezza a causa di piccole unità di aggregazione, altri semplicemente non erano disponibili ma non a causa delle variabili esplicative che incidono su altre varibales. Ho valori zero reali per cui, lo zero non rappresenta alcun evento / tasso per quel particolare poligono e ho anche alcuni valori null in cui mancano i dati. Dato che ho circa 29 variabili esplicative con cui iniziare, se elimino i poligoni dove per le righe che contengono valori nulli, sto perdendo 8 poligoni su 279 e speravo di non doverlo fare. Grazie!
I Heart Beats,

Sono contento che tu abbia informazioni e teorie sulla mancanza. Potresti voler essere un po 'cauto su quelle piccole unità, perché i valori di quasi tutte le variabili potrebbero essere plausibilmente correlati alla dimensione della regione che rappresenta, creando così un potenziale pregiudizio nel modello di mancanza.
whuber

2
È possibile incorporare valori null introducendo variabili per indicare la loro presenza e codificando tutti i risultati null originali con un valore comune (il valore scelto non ha importanza). Sarà necessario un indicatore separato per ogni variabile che contiene valori nulli. Qualunque cosa tu faccia, non sostituire semplicemente i null con zeri (o qualsiasi altra costante)! Un null significa qualcosa di completamente diverso da zero.
whuber

1
@whuber Sembra che ci possa essere abbastanza nei tuoi commenti per scrivere una risposta su questo.
PolyGeo

Risposte:


1

Puoi provare a indovinare i valori "null" dai dati circostanti. Sarebbe meglio che lasciarli fuori, perché in questo modo non perderai i dati. Ovviamente devi stare attento a come indovini i valori. Perché se la tua ipotesi è distorta, lo sarà anche il tuo modello.

vedi anche: http://handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

e:

Attenzione:

Ogni volta che si utilizzano gli shapefile, tenere presente che non è possibile memorizzare valori null. Strumenti o altre procedure che creano shapefile da input nonshapefile possono, di conseguenza, memorizzare valori null come zero o come un numero negativo molto piccolo (-DBL_MAX = -1.7976931348623158e + 308). Ciò può portare a risultati imprevisti. Vedi anche: Considerazioni sul geoprocessing per l'output del file di forma. ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm )

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.