Come trovare la matrice di covarianza di un poligono?

Immagina di avere un poligono definito da un insieme di coordinate e il suo centro di massa è a . Puoi considerare il poligono come una distribuzione uniforme con un confine poligonale. $(x_1,y_1)...(x_n,y_n)$ $(0,0)$

Sto seguendo un metodo che troverà la matrice di covarianza di un poligono .

Sospetto che la matrice di covarianza di un poligono sia strettamente correlata al secondo momento dell'area , ma non sono sicuro che siano equivalenti. Le formule trovate nell'articolo di Wikipedia che ho collegato sembrano (un'ipotesi qui, non mi è particolarmente chiaro dall'articolo) per riferirsi all'inerzia rotazionale attorno agli assi x, ye z piuttosto che agli assi principali del poligono.

(Per inciso, se qualcuno può indicarmi come calcolare gli assi principali di un poligono, sarebbe utile anche a me)

È allettante eseguire solo PCA sulle coordinate , ma ciò si traduce nel problema che le coordinate non sono necessariamente distribuite uniformemente attorno al poligono e quindi non sono rappresentative della densità del poligono. Un esempio estremo è il profilo del Nord Dakota, il cui poligono è definito da un gran numero di punti che seguono il fiume Rosso, più solo altri due punti che definiscono il margine occidentale dello stato.

pca covariance-matrix polygon

— Ingolifs
fonte

Con "trova", presumo semplicemente il campionamento dal poligono, quindi il calcolo della covarianza dei campioni, non è quello che hai in mente?

— Stephan Kolassa,

Inoltre, puoi modificare il tuo post per includere le coordinate per il tuo poligono, in modo che le persone possano giocarci?

— Stephan Kolassa,

@StephanKolassa Intendo trattare il poligono come una densità di probabilità bivariata uniforme con confine poligonale. Certo, puoi campionare punti e il limite sarebbe la stessa cosa, ma sto cercando un metodo a priori. L'immagine è solo un'illustrazione della vernice che ho usato. I dati del mondo reale che intendo utilizzare sono i contorni di stati e regioni.

— Ingolifs

Hai ragione a dire che il termine abituale per "matrice di covarianza" è momento di inerzia o secondo momento. Gli assi principali sono orientati nelle sue direzioni. L'esecuzione di PCA sulle coordinate non è corretta: equivale a supporre che tutta la massa si trovi sui vertici. I metodi più diretti di calcolo del baricentro - il primo momento - sono discussi nel mio post su gis.stackexchange.com/a/22744/664 . I secondi momenti vengono calcolati allo stesso modo con piccole modifiche. Considerazioni speciali sono necessarie sulla sfera.

— whuber

Funziona diversamente: calcola il tensore inerziale e trova i suoi assi principali da quello. La tecnica nel tuo caso coinvolge il Teorema di Green, che mostra che gli integrali richiesti può essere calcolato come integrale di contorno attorno a della forma unica doveTali forme sono facili da trovare perché qualsiasi combinazione lineare adatto di e funzionerà. L'integrale del contorno è una somma di integrali sui bordi.

μ_{k, l} (P) = \iint_{P} x^{k} y^{l} d x d y

$\mu_{k,l}(\mathcal{P})=\iint_{\mathcal{P}}x^ky^l\mathrm{d}x\mathrm{d}y$

\partial P

$\partial\mathcal{P}$

ω

$\omega$

d ω = x^{k} y^{l} d x d y .

$\mathrm{d}\omega=x^ky^l\mathrm{d}x\mathrm{d}y.$

x^{k} y^{l + 1} d x

$x^ky^{l+1}\mathrm{d}x$

x^{k + 1} y^{l} d y

$x^{k+1}y^l\mathrm{d}y$

— whuber

Risposte:

Facciamo prima alcune analisi.

Supponiamo che all'interno del poligono sua densità di probabilità sia la funzione proporzionale Quindi la costante di proporzionalità è l'inverso dell'integrale di sul poligono, $\mathcal{P}$ $p(x,y).$ $p$

μ_{0, 0} (P) = \iint_{P} p (x, y) d x d y .

$\mu_{0,0}(\mathcal{P})=\iint_{\mathcal P} p(x,y) \mathrm{d}x\,\mathrm{d}y.$

Il baricentro del poligono è il punto di coordinate medie, calcolato come i loro primi momenti. Il primo è

μ_{1, 0} (P) = \frac{1}{μ_{0, 0} (P)} \iint_{P} x p (x, y) d x d y .

$\mu_{1,0}(\mathcal{P})=\frac{1}{\mu_{0,0}(\mathcal{P})} \iint_{\mathcal P} x\,p(x,y)\mathrm{d}x\,\mathrm{d}y.$

Il tensore inerziale può essere rappresentato come la matrice simmetrica dei secondi momenti calcolata dopo aver tradotto il poligono per mettere il suo baricentro all'origine: cioè la matrice dei secondi momenti centrali

μ_{k, l}^{'} (P) = \frac{1}{μ_{0, 0} (P)} \iint_{P} {(x - μ_{1, 0} (P))}^{k} {(y - μ_{0, 1} (P))}^{l} p (x, y) d x d y

$\mu^\prime_{k,l}(\mathcal{P}) = \frac{1}{\mu_{0,0}(\mathcal{P})} \iint_{\mathcal P} \left(x - \mu_{1,0}(\mathcal{P})\right)^k\,\left(y - \mu_{0,1}(\mathcal{P})\right)^l\,p(x,y)\mathrm{d}x\,\mathrm{d}y$

dove vanno da a a Il tensore stesso - alias matrice di covarianza - lo è $(k,l)$ $(2,0)$ $(1,1)$ $(0,2).$

I (P) = (\begin{matrix} μ_{2, 0}^{'} (P) & μ_{1, 1}^{'} (P) \\ μ_{1, 1}^{'} (P) & μ_{0, 2}^{'} (P) \end{matrix}) .

$I(\mathcal{P}) = \pmatrix{\mu^\prime_{2,0}(\mathcal{P}) & \mu^\prime_{1,1}(\mathcal{P}) \\ \mu^\prime_{1,1}(\mathcal{P}) & \mu^\prime_{0,2}(\mathcal{P})}.$

Un PCA di produce gli assi principali di questi sono gli autovettori di unità scalati in base ai loro autovalori. $I(\mathcal{P})$ $\mathcal{P}:$

Quindi, scopriamo come eseguire i calcoli. Poiché il poligono è presentato come una sequenza di vertici che ne descrive il confine orientato è naturale invocare $\partial\mathcal P,$

Teorema di Green: dove è una forma unica definita in un quartiere di e
$\iint_{P} d ω = \oint_{\partial P} ω$ $\iint_{\mathcal{P}} \mathrm{d}\omega = \oint_{\partial\mathcal{P}}\omega$ $\omega = M(x,y)\mathrm{d}x + N(x,y)\mathrm{d}y$ $\mathcal{P}$ $d ω = (\frac{\partial}{\partial x} N (x, y) - \frac{\partial}{\partial y} M (x, y)) d x d y .$ $\mathrm{d}\omega = \left(\frac{\partial}{\partial x}N(x,y) - \frac{\partial}{\partial y}M(x,y)\right)\mathrm{d}x\,\mathrm{d}y.$

Ad esempio, con e densità costante ( cioè uniforme) possiamo (per ispezione) selezionare uno dei tanti soluzioni, come $\mathrm{d}\omega = x^k y^l \mathrm{d}x\mathrm{d}y$ $p,$

ω (x, y) = \frac{- 1}{l + 1} x^{k} y^{l + 1} d x .

$\omega(x,y) = \frac{-1}{l+1}x^k y^{l+1}\mathrm{d}x.$

Il punto di ciò è che l'integrale del contorno segue i segmenti di linea determinati dalla sequenza dei vertici. Qualsiasi segmento di linea da vertice a vertice può essere parametrizzato da una variabile reale nel modulo $\mathbf{u}$ $\mathbf{v}$ $t$

t \to u + t w

$t \to \mathbf{u} + t\mathbf{w}$

dove è la direzione normale dell'unità da aI valori di pertanto vanno da a Sotto questa parametrizzazione ed sono funzioni lineari di e e sono funzioni lineari di Pertanto l'integrando dell'integrale del contorno su ciascun bordo diventa una funzione polinomiale di che può essere facilmente valutata per piccoli e $\mathbf{w} \propto \mathbf{v}-\mathbf{u}$ $\mathbf{u}$ $\mathbf{v}.$ $t$ $0$ $|\mathbf{v}-\mathbf{u}|.$ $x$ $y$ $t$ $\mathrm{d}x$ $\mathrm{d}y$ $\mathrm{d}t.$ $t,$ $k$ $l.$

L'implementazione di questa analisi è semplice come codificare i suoi componenti. Al livello più basso avremo bisogno di una funzione per integrare una forma polinomiale su un segmento di linea. Le funzioni di livello superiore le aggregheranno per calcolare i momenti grezzi e centrali per ottenere il baricentro e il tensore inerziale, e infine potremo operare su quel tensore per trovare gli assi principali (che sono i suoi autovettori scalati). Il Rcodice seguente esegue questo lavoro. Non fa pretese di efficienza: intende solo illustrare l'applicazione pratica dell'analisi che precede. Ogni funzione è semplice e le convenzioni di denominazione sono parallele a quelle dell'analisi.

Nel codice è inclusa una procedura per generare poligoni validi chiusi, semplicemente connessi e non autointersecanti (deformando casualmente i punti lungo un cerchio e includendo il vertice iniziale come punto finale per creare un circuito chiuso). Di seguito sono riportate alcune affermazioni per tracciare il poligono, visualizzare i suoi vertici, adiacente al baricentro e tracciare gli assi principali in rosso (il più grande) e blu (il più piccolo), creando un sistema di coordinate orientato positivamente al poligono.

#
# Integrate a monomial one-form x^k*y^l*dx along the line segment given as an 
# origin, unit direction vector, and distance.
#
lintegrate <- function(k, l, origin, normal, distance) {
  # Binomial theorem expansion of (u + tw)^k
  expand <- function(k, u, w) {
    i <- seq_len(k+1)-1
    u^i * w^rev(i) * choose(k,i)
  }
  # Construction of the product of two polynomials times a constant.
  omega <- normal[1] * convolve(rev(expand(k, origin[1], normal[1])), 
                                expand(l, origin[2], normal[2]),
                                type="open")
  # Integrate the resulting polynomial from 0 to `distance`.
  sum(omega * distance^seq_along(omega) / seq_along(omega))
}
#
# Integrate monomials along a piecewise linear path given as a sequence of
# (x,y) vertices.
#
cintegrate <- function(xy, k, l) {
  n <- dim(xy)[1]-1 # Number of edges
  sum(sapply(1:n, function(i) {
    dv <- xy[i+1,] - xy[i,]               # The direction vector
    lambda <- sum(dv * dv)
    if (isTRUE(all.equal(lambda, 0.0))) {
      0.0
    } else {
      lambda <- sqrt(lambda)              # Length of the direction vector
      -lintegrate(k, l+1, xy[i,], dv/lambda, lambda) / (l+1)
    }
  }))
}
#
# Compute moments of inertia.
#
inertia <- function(xy) {
  mass <- cintegrate(xy, 0, 0)
  barycenter = c(cintegrate(xy, 1, 0), cintegrate(xy, 0, 1)) / mass
  uv <- t(t(xy) - barycenter)   # Recenter the polygon to obtain central moments
  i <- matrix(0.0, 2, 2)
  i[1,1] <- cintegrate(uv, 2, 0)
  i[1,2] <- i[2,1] <- cintegrate(uv, 1, 1)
  i[2,2] <- cintegrate(uv, 0, 2)
  list(Mass=mass,
       Barycenter=barycenter,
       Inertia=i / mass)
}
#
# Find principal axes of an inertial tensor.
#
principal.axes <- function(i.xy) {
  obj <- eigen(i.xy)
  t(t(obj$vectors) * obj$values)
}
#
# Construct a polygon.
#
circle <- t(sapply(seq(0, 2*pi, length.out=11), function(a) c(cos(a), sin(a))))
set.seed(17)
radii <- (1 + rgamma(dim(circle)[1]-1, 3, 3))
radii <- c(radii, radii[1])  # Closes the loop
xy <- circle * radii
#
# Compute principal axes.
#
i.xy <- inertia(xy)
axes <- principal.axes(i.xy$Inertia)
sign <- sign(det(axes))
#
# Plot barycenter and principal axes.
#
plot(xy, bty="n", xaxt="n", yaxt="n", asp=1, xlab="x", ylab="y",
     main="A random polygon\nand its principal axes", cex.main=0.75)
polygon(xy, col="#e0e0e080")
arrows(rep(i.xy$Barycenter[1], 2), 
       rep(i.xy$Barycenter[2], 2),
       -axes[1,] + i.xy$Barycenter[1],     # The -signs make the first axis .. 
       -axes[2,]*sign + i.xy$Barycenter[2],# .. point to the right or down.
       length=0.1, angle=15, col=c("#e02020", "#4040c0"), lwd=2)
points(matrix(i.xy$Barycenter, 1, 2), pch=21, bg="#404040")

— whuber
fonte

+1 Caspita, questa è un'ottima risposta!

— amoeba,

Modifica: non ho notato che whuber aveva già risposto. Lascio questo come esempio di un altro (forse meno elegante) approccio al problema.

La matrice di covarianza

Let sia un punto casuale dalla distribuzione uniforme su un poligono con area . La matrice di covarianza è: $(X,Y)$ $P$ $A$

C = [\begin{matrix} C_{X X} & C_{X Y} \\ C_{X Y} & C_{Y Y} \end{matrix}]

$C = \begin{bmatrix} C_{XX} & C_{XY} \\ C_{XY} & C_{YY} \end{bmatrix}$

dove è la varianza di , è la varianza di e è la covarianza tra e . Ciò presuppone una media zero, poiché il centro di massa del poligono si trova all'origine. La distribuzione uniforme assegna densità di probabilità costante a ogni punto in , quindi: $C_{XX} = E[X^2]$ $X$ $C_{YY} = E[Y^2]$ $Y$ $C_{XY} = E[XY]$ $X$ $Y$ $\frac{1}{A}$ $P$

\begin{matrix} (1) & C_{X X} = \frac{1}{A} \iint_{P} x^{2} d V C_{Y Y} = \frac{1}{A} \iint_{P} y^{2} d V C_{X Y} = \frac{1}{A} \iint_{P} x y d V \end{matrix}

$C_{XX} = \frac{1}{A} \underset{P}{\iint} x^2 dV \quad C_{YY} = \frac{1}{A} \underset{P}{\iint} y^2 dV \quad C_{XY} = \frac{1}{A} \underset{P}{\iint} x y dV \tag{1}$

Triangolazione

Invece di provare a integrarci direttamente in una regione complicata come , possiamo semplificare il problema suddividendo in sottoregioni triangolari: $P$ $P$ $n$

P = T_{1} \cup \dots \cup T_{n}

$P = T_1 \cup \cdots \cup T_n$

Nel tuo esempio, un possibile partizionamento è simile al seguente:

Esistono vari modi per produrre una triangolazione (vedi qui ). Ad esempio, potresti calcolare la triangolazione di Delaunay dei vertici, quindi scartare i bordi che cadono fuori da (poiché potrebbe essere non convesso come nell'esempio). $P$

Gli integrali su possono quindi essere suddivisi in somme di integrali sui triangoli: $P$

\begin{matrix} (2) & C_{X X} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} x^{2} d V C_{Y Y} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} y^{2} d V C_{X Y} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} x y d V \end{matrix}

$C_{XX} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} x^2 dV \quad C_{YY} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} y^2 dV \quad C_{XY} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} x y dV \tag{2}$

Un triangolo ha dei confini piacevoli e semplici, quindi questi integrali sono più facili da valutare.

Integrazione su triangoli

Esistono vari modi per integrare i triangoli. In questo caso, ho usato un trucco che comporta la mappatura di un triangolo sul quadrato dell'unità. Trasformarsi in coordini baricentrici potrebbe essere un'opzione migliore.

Ecco le soluzioni per gli integrali sopra, per un triangolo arbitrario definito da vertici . Permettere: $T$ $(x_1,y_1), (x_2,y_2), (x_3,y_3)$

v_{x} = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \end{matrix}] v_{y} = [\begin{matrix} y_{1} \\ y_{2} \\ y_{3} \end{matrix}] \vec{1} = [\begin{matrix} 1 \\ 1 \\ 1 \end{matrix}] L = [\begin{matrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{matrix}]

$v_x = \left[ \begin{smallmatrix} x_1 \\ x_2 \\ x_3 \end{smallmatrix} \right] \quad v_y = \left[ \begin{smallmatrix} y_1 \\ y_2 \\ y_3 \end{smallmatrix} \right] \quad \vec{1} = \left[ \begin{smallmatrix} 1 \\ 1 \\ 1 \end{smallmatrix} \right] \quad L = \left[ \begin{smallmatrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{smallmatrix} \right]$

Poi:

\begin{matrix} (3) & \iint_{T} x^{2} d V = \frac{A}{6} Tr (v_{x} v_{x}^{T} L) \iint_{T} y^{2} d V = \frac{A}{6} Tr (v_{y} v_{y}^{T} L) \iint_{T} x y d V = \frac{A}{12} ({\vec{1}}^{T} v_{x} v_{y}^{T} \vec{1} + v_{x}^{T} v_{y}) \end{matrix}

$\underset{T}{\iint} x^2 dV = \frac{A}{6} \text{Tr}(v_x v_x^T L) \quad \underset{T}{\iint} y^2 dV = \frac{A}{6} \text{Tr}(v_y v_y^T L) \quad \underset{T}{\iint} x y dV = \frac{A}{12} (\vec{1}^T v_x v_y^T \vec{1} + v_x^T v_y) \tag{3}$

Mettere tutto insieme

Lascia che e contengano le coordinate x / y dei vertici per ciascun triangolo , come sopra. Collega a per ciascun triangolo, osservando che i termini dell'area si annullano. Questo dà la soluzione: $v_x^i$ $v_y^i$ $T_i$ $(3)$ $(2)$

\begin{matrix} (4) & C_{X X} = \frac{1}{6} \sum_{i = 1}^{n} Tr (v_{x}^{i} (v_{x}^{i})^{T} L) C_{Y Y} = \frac{1}{6} \sum_{i = 1}^{n} Tr (v_{y}^{i} (v_{y}^{i})^{T} L) C_{X Y} = \frac{1}{12} \sum_{i = 1}^{n} ({\vec{1}}^{T} v_{x}^{i} (v_{y}^{i})^{T} \vec{1} + (v_{x}^{i})^{T} v_{y}^{i}) \end{matrix}

$C_{XX} = \frac{1}{6} \sum_{i=1}^n \text{Tr} \big( v_x^i (v_x^i)^T L \big) \quad C_{YY} = \frac{1}{6} \sum_{i=1}^n \text{Tr} \big( v_y^i (v_y^i)^T L \big) \quad C_{XY} = \frac{1}{12} \sum_{i=1}^n \big( \vec{1}^T v_x^i (v_y^i)^T \vec{1} + (v_x^i)^T v_y^i \big) \tag{4}$

Assi principali

Gli assi principali sono dati dagli autovettori della matrice di covarianza , proprio come nel PCA. A differenza della PCA, abbiamo un'espressione analitica per , piuttosto che doverla stimare da punti di dati campionati. Si noti che i vertici stessi non sono un campione rappresentativo della distribuzione uniforme su , quindi non si può semplicemente prendere la matrice di covarianza del campione dei vertici. Ma * è * una funzione relativamente semplice dei vertici, come si vede in . $C$ $C$ $P$ $C$ $(4)$

— user20160
fonte

+1 Questo può essere semplificato consentendo triangoli orientati , eliminando così la necessità di una triangolazione corretta. Invece, puoi semplicemente stabilire un centro arbitrario e sommare i valori (firmati) sui triangoli è così che viene spesso fatto perché è molto meno esigente. È facile vedere che una simile somma è essenzialmente la stessa cosa dell'applicazione del Teorema di Green, perché ogni termine nella somma alla fine è una funzione del bordoQuesto approccio è illustrato nella sezione "Area" di quantdec.com/SYSEN597/GTKAV/section2/chapter_11.htm .

O

$O$

O P_{i} P_{i + 1} :

$OP_iP_{i+1}:$

P_{i} P_{i + 1} .

$P_iP_{i+1}.$

— whuber

@whuber Interessante, grazie per

— averlo segnalato

Entrambe queste risposte sono buone, anche se un po 'oltre il mio livello di istruzione. Una volta che sono sicuro di averli pienamente capiti, cercherò di capire chi ottiene la taglia.

— Ingolifs,