Un database di (popolazione, area, forma) può essere utilizzato per mappare la densità di popolazione assegnando un valore costante di popolazione / area a ciascuna forma (che è un poligono come un blocco censimento, tratto, contea, stato, qualunque cosa). Le popolazioni di solito non sono distribuite uniformemente nei loro poligoni, tuttavia. La mappatura dasimetrica è il processo di perfezionamento di queste stime di densità mediante dati ausiliari. È un problema importante nelle scienze sociali come indica questa recente recensione .
Supponiamo quindi di avere a disposizione una mappa ausiliaria della copertura del suolo (o di qualsiasi altro fattore discreto). Nel caso più semplice possiamo usare aree ovviamente inabitabili come i corpi idrici per delineare dove non c'è la popolazione e, di conseguenza, assegnare tutta la popolazione alle aree rimanenti. Più in generale, ogni unità di censimento è scolpita in porzioni aventi aree di superficie , . Il nostro set di dati viene quindi aumentato in un elenco di tuple
dove è la popolazione (assunto misurata senza errore) nell'unità e - anche se questo non è rigorosamente il caso - possiamo supporre ogni è anche esattamente misurato. In questi termini, l'obiettivo è dividere ogni in una somma
dove ogni e z j i stimano la popolazione all'interno dell'unità j residente nella classe di copertura del suolo i . Le stime devono essere imparziali. Questa partizione raffina la mappa densità di popolazione assegnando la densità z j I / x j i all'intersezione della j esimo censimento poligono e l' ho esimo classe di copertura del suolo.
Questo problema differisce dalle impostazioni di regressione standard in modi salienti:
- Il partizionamento di ogni deve essere esatto.
- I componenti di ogni partizione devono essere non negativi.
- Non c'è (presumibilmente) alcun errore in nessuno dei dati: tutta la popolazione conta e tutte le aree x j i sono corrette.
Esistono molti approcci a una soluzione, come il metodo di " mappatura dasimetrica intelligente ", ma tutti quelli di cui ho letto hanno elementi ad hoc e un evidente potenziale di distorsione. Sto cercando risposte che suggeriscano metodi statistici creativi, calcolabili dal punto di vista computazionale. L'applicazione immediata riguarda una raccolta di c. - 10 6 Unità di censimento in media 40 persone ciascuna (sebbene una frazione considerevole abbia 0 persone) e circa una dozzina di classi di copertura del suolo.