Come eseguire il grid dei dati categoriali campionati in modo non uniforme?


10

Sto cercando un metodo per ottenere dati categorici. Ho estratto da carte nautiche e fogli di campo una raccolta di punti che specifica la natura della superficie del fondo dell'oceano. Questi dati sono categorici piuttosto che numerici e non vengono campionati regolarmente né casualmente. Le carte nautiche sono create per facilitare la navigazione e l'ancoraggio; non sono creati per mappare l'habitat. Come tale, vengono fatti più sondaggi vicino alla riva dove profondità relativamente basse possono costituire un pericolo per la navigazione e dove le navi tendono ad ancorare. Più lontano dalla riva, dove le profondità sono più che adeguate per la navigazione e l'ancoraggio è poco pratico, i sondaggi vengono effettuati molto meno frequentemente.

Qualcun altro ha provato a creare mappe di substrati con griglia da carte nautiche?

Ho osservato i poligoni di Thiessen (Vornoi), ma la concentrazione di sondaggi lungo le rive porta a un sottile "nido d'ape" lungo la riva, grandi poligoni al largo e tra lunghi poligoni a forma di torta che si estendono al largo. Gridare usando il vicino più vicino produce praticamente lo stesso risultato.

Ho bisogno di un modo per limitare l'influenza dei punti poco profondi e vicini alla riva - un modo per limitare quei lunghi poligoni a forma di torta. Nelle acque più profonde non mi aspetto che la natura del fondo sarà una continuazione del fondo vicino alla riva. Ho iniziato a pensare in due modi: entrambi usando la profondità. Uno sta ponderando la scelta del vicino più vicino usando la differenza di profondità tra una cella della griglia e punti vicini. Un altro è deselezionare i punti vicini che sono più di una tolleranza specificata diversa in profondità. O, forse piuttosto che una tolleranza prestabilita, potrei raccogliere intervalli di profondità e quindi limitare la scelta dei punti vicini a quelli dello stesso intervallo di profondità o contenitore.

Qualche idea su come implementare una di queste due opzioni?

Da quando ho parlato con i colleghi su altri forum, ho esaminato un paio di altri approcci. Il primo prevede l'uso di una barriera, il profilo di profondità di 100 m, per limitare l'influenza dei dati sulla riva. La sfida con questo approccio è che qualsiasi routine di interpolazione ESRI che può usare barriere è progettata per funzionare con dati continui piuttosto che con dati discontinui. Potrei usare le barriere per spezzare i punti in riva poco profonda e punti più profondi prima di creare poligoni di Thiessen. Tuttavia, prevedo effetti di bordo dilaganti poiché ArcGIS crea poligoni di Teessen per aree rettangolari non per aree complesse.

Il secondo approccio - suggerito da diversi colleghi - era il kriging. Inizialmente avevo scartato il kriging perché l'ho sempre considerato solo per dati continui. La sfida con kriging è che anch'essa non è progettata per dati categorici. Ora, sto guardando cokriging con profondità e natura della superficie, ma qualsiasi tipo di kriging implicherà l'utilizzo di codici numerici interi per la natura della superficie. Successivamente i codici numerici in virgola mobile risultanti dovranno essere ridotti alla codifica intera originale. Non carino.

Qualcuno può suggerire altre linee da seguire? (Forse si potrebbe usare l'analisi del terreno. Ad esempio, le pendenze più ripide dell'angolo di riposo non potrebbero essere sedimenti. Sto cercando qualcosa di più semplice e, in ogni caso, non ho dati con una risoluzione spaziale sufficiente.)

Saluti,

Risposte:


4

L'approccio kriging, opportunamente implementato, è promettente.

Come punto di partenza, guardiamo ai "modelli geostatistici lineari generalizzati" descritti da Diggle & Ribeiro nella Geostatistica basata sui modelli (Springer 2007). L'idea di base è accattivante e flessibile: un processo stocastico spaziale (che è spazialmente continuo ) determina le varie probabilità delle categorie. Si usano le categorie osservate in punti irregolari per inferire le proprietà statistiche di quel processo sottostante, inclusa la sua struttura di correlazione spaziale (variogramma). Kriging crea quindi una superficie di probabilità coerente con le osservazioni. A quel punto puoi eseguire simulazioni geostatistiche o puoi creare mappe relative alle probabilità (come mappe delle categorie di massima probabilità, immagino).

Sembra sofisticato, e lo è. Tuttavia, la discussione di Diggle e Ribeiro è abbastanza accessibile - sebbene sia matematica e presupponga una certa conoscenza delle statistiche, non si basa molto su nessuno dei due - e la maggior parte delle loro tecniche sono implementate in pacchetti R che descrivono geoRe geoRGLM. In effetti, è giusto interpretare questo libro come il manuale di questi pacchetti.

Come attestano altri thread su questo sito, è relativamente facile interfacciare R con i dati GIS (inclusi shapefile e vari formati raster), quindi non è un problema.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.