Efficiente campionamento più brevi

14

Lasciate $G$ un grafo, e lasciare $s$ e $t$ essere due vertici di $G$ . È possibile campionare in modo efficiente un percorso $s$ - più breve in $t$ modo uniforme e indipendente in modo casuale dall'insieme di tutti i percorsi più brevi tra $s$ e $t$ ? Per semplicità, possiamo presumere che $G$ sia semplice, non orientato e non ponderato.

Anche in molti grafici ristrette il numero di cammini minimi tra $s$ e $t$ può essere esponenziale nella dimensione di $G$ . Pertanto, saremmo naturalmente, come evitare di realtà calcolando tutte le più breve $s$ - $t$ percorsi. Non conosco il caso generale, ma mi sembra che possiamo raggiungere questo obiettivo per alcune classi di grafi speciali.

Sembra qualcosa che qualcuno deve aver considerato prima. C'è qualche ricerca esistente in questo, o è in realtà semplice da fare anche per i grafici generali?

— Juho
fonte

Bella domanda Juho. Considerando una risposta, cosa capisci esattamente "campionando un percorso uniformemente a caso"? Se è sufficiente che s e t vengano rilevati casualmente, la domanda è banale, quindi immagino che intendi che tutti i nodi nel percorso più breve compaiano con una frequenza (cioè, probabilità) che segue una distribuzione uniforme. O c'è qualche altra definizione? In particolare, per i grafici bipartiti la tua domanda sembra essere molto semplice, vero?

— Carlos Linares López,

1

@ CarlosLinaresLópez Considerare di dire il grafico a diamante e dire che

è sul lato destro del "bordo verticale" e

è sul lato sinistro. Ora ci sono 2 percorsi più brevi tra

e

. L'algoritmo dovrebbe restituire con uguale probabilità uno di questi due percorsi. Quindi

e

non vengono "raccolti casualmente", ma vengono forniti come input. Questo lo chiarisce? In questo senso, non sono sicuro che il problema sia davvero semplice per i grafici bipartiti.

s

$s$

t

$t$

s

$s$

t

$t$

s

$s$

t

$t$

— Juho,

1

@ CarlosLinaresLópez In altre parole, ci viene dato un grafico

e due vertici

. Sia

l'insieme di tutti i percorsi più brevi tra

e

. Emette un elemento di

uniformemente a caso.

G

$G$

s, t \in V (G)

$s,t \in V(G)$

S

$S$

s

$s$

t

$t$

S

$S$

— Juho,

6

Non sono sicuro al 100% che questa risposta sia corretta, ma ecco qui:

Penso che puoi ridurlo a qualsiasi percorso uniformemente uniforme, da $s-t$ , in un DAG con una sola sorgente e un singolo sink.

Dato un grafico $G$

Crea un nuovo digrafo vuoto, . $H$
Primo: esegui la parte BFS del percorso più breve di Dijkstra, partendo da , segna tutti i nodi con la loro distanza più breve da- $s$ . $s$
Sia la distanza minima da ; che conosciamo dal passaggio BFS dell'algoritmo del percorso più breve di Dijkstra. $d(s,v)$ $s-v$
Quindi fai il passo successivo dell'algoritmo del percorso più breve di Dijkstra, ottieni il percorso più breve, memorizzalo in (andando indietro da a $\mathbf p$ $t$ $s$ ).
Ora avvia il seguente ciclo; spiegazione nei commenti e sotto:
- $q_0=\{t\}$
- Mentre
  - $q_1= \emptyset$
  - Per
    - Quindi vogliamo trovare tutti i possibili nodi successivi per questo sottotraccia più breve da $t-u$
    - Per tutti i tale che d ( s , v ) < d ( s , u )
      - è un nodo vicino, con meno (sarà meno) $v$ $d(s,\cdot)$ $1$
      - Pertanto, è possibile sottotraccia in un percorso più breve. $t-u-v$
      - Inserisci $v \rightarrow H, \text{di-edge}(u,v)\rightarrow H$
      - Ora dobbiamo controllare i vicini di minori il prossimo turno. $v$
      - Inserisci $v \rightarrow q_1$
  - Impostare su q 1 :
    - $q_0 \leftarrow q_1$

Essenzialmente, sto raccogliendo tutti i possibili nodi che possono essere utilizzati nel percorso più breve, e metterli in . $H$

Maggiori informazioni su come funziona:

L'algoritmo del percorso più breve di Dijkstra funziona eseguendo prima un BFS e contrassegnando tutti i nodi con i percorsi più brevi da . Il prossimo passo è tornare indietro da e seguire indietro i nodi meno vicini. $v\in G$ $s-v$ $t-s$

Il fatto è che qui puoi scegliere uno dei nodi meno vicini. Quello che faccio qui è raccogliere tutti i nodi meno vicini ogni passaggio, il che significa che conto per tutti i percorsi più brevi.

Ora pensi rapidamente, ma hey, perché li sta enumerando in modo esponenziale, ma la mia strada non lo è?

La risposta è che, poiché utilizzo un set per evitare di aggiungere due volte gli stessi nodi, evito di ricalcolarlo per ogni possibile percorso.

Ora abbiamo un DAG che possiamo attraversare in qualsiasi modo da , e ottenere un percorso inverso più breve da . Il grafico dovrebbe avere come unica fonte e come unico sink. $t-s$ $s-t$ $t$ $s$

Se quanto sopra è corretto, penso che possiamo fare un ulteriore passo avanti e risolvere il problema come segue.

Assegna a ciascun nodo nel DAG un peso-nodo; il peso del nodo sarà il numero di percorsi da quel nodo a . Chiamiamolo . $s$ $w(v)$

È possibile calcolare questi rapidamente, vedere Algoritmo che trova il numero di semplici percorsi da s a t in G .

Una volta che abbiamo il peso del nodo, possiamo scegliere uniformemente un percorso per:

~~Layout del DAG come struttura di livello (per visualizzazione)~~
~~Ad ogni livello, scegliere un ordinamento arbitrario tra i nodi, ad es. una nozione di "da sinistra a destra".~~
Attraversare il DAG: ad ogni passo , i ∈ [ 1 , | p | ] (dove | ⋅ | indica la dimensione di, in questo caso, la lunghezza del percorso più breve):
- Let tramite il nodo corrente (a partire da $u_i$ $t$ )
- Sommate tutti i pesi dei figli di , e l'utilizzo di un RNG, scegliere uno nodo figlio, $u_i$ $v_i$ , in modo uniforme tra i bambini ponderati.
- Imposta e vai al passaggio successivo $u_{i+1} = v_i$

— Realz Slaw
fonte

La struttura dei livelli e la nozione di sinistra-destra facevano parte del mio tentativo iniziale di generare semplicemente

e scegliere un percorso in quel modo, ma non l'ho capito, quindi puoi tranquillamente ignorarli.

r \in [0, w (t))

$r\in \left[0,w(t)\right)$

— Realz Slaw,

1

Questa risposta è fantastica! Adoro le idee! Ho provato a scriverlo in un modo leggermente diverso (nella mia risposta), come prova della mia comprensione. In ogni caso, volevo solo condividere il mio apprezzamento per questa bella risposta!

— DW

5

Ecco una soluzione basata sulle idee nella risposta di Realz Slaw. Fondamentalmente è una riesposizione delle sue idee che potrebbe essere più chiara o più facile da seguire. Il piano è che procederemo in due fasi:

In primo luogo, si costruirà un grafico con la seguente struttura: qualsiasi percorso da a in è un cammino minimo da a in , ed ogni cammino minimo da a in è presente anche in . Pertanto, contiene esattamente i percorsi più brevi in : tutti i percorsi più brevi e niente di più. Come succede, sarà un DAG. $S$ $s$ $t$ $S$ $s$ $t$ $G$ $s$ $t$ $G$ $S$ $S$ $G$ $S$
Successivamente, si campionare uniformemente a caso da tutti i percorsi da a in . $s$ $t$ $S$

Questo approccio si generalizza a un grafico diretto arbitrario , purché tutti i bordi abbiano un peso positivo, quindi spiegherò il mio algoritmo in questi termini. Lascia che indichi il peso sul bordo . (Questo generalizza l'affermazione del problema che hai dato. Se hai un grafico non ponderato, supponi solo che ogni bordo abbia peso 1. Se hai un grafico non orientato, tratta ogni bordo non orientato come i due bordi diretti e .) $G$ $w(u,v)$ $u \to v$ $(u,v)$ $u\to v$ $v\to u$

Fase 1: estratto di . $S$ Esegui un algoritmo di percorsi più brevi a sorgente singola (ad esempio, l'algoritmo di Dijkstra) su , a partire dalla sorgente . Per ogni vertice in , denota la distanza da a . $G$ $s$ $v$ $G$ $d(s,v)$ $s$ $v$

Ora definisci il grafico come segue. È costituito da ogni bordo tale che (1) sia un bordo in e (2) . $S$ $u \to v$ $u \to v$ $G$ $d(s,v) = d(s,u) + w(u,v)$

Il grafico ha alcune proprietà convenienti: $S$

Ogni percorso più breve da a in esiste come percorso in : un percorso più breve in ha la proprietà che $s$ $t$ $G$ $S$ $s=v_0,v_1,v_2,\dots,v_k=t$ $G$ $d(s,v_{i+1})=d(s,v_i)+w(v_i,v_{i+1})$ , so the edge $v_i \to v_{i+1}$ is present in $S$ .
Every path in $S$ from $s$ to $t$ is a shortest path in $G$ . In particular, consider any path in $S$ from $s$ to $t$ , say $s=v_0,v_1,v_2,\dots,v_k=t$ . Its length is given by the sum of the weights of its edges, namely $\sum_{i=1}^k w(v_{i-1},v_i)$ $S$ $\sum_{i=1}^k (d(s,v_i)-d(s,v_{i-1})$ $d(s,t)-d(s,s)=d(s,t)$ . Therefore, this path is a shortest path from $s$ to $t$ in $G$ .
Finally, the absence of zero-weight edges in $G$ implies that $S$ is a dag.

Step 2: sample a random path. Now we can throw away the weights on the edges in $S$ , and sample a random path from $s$ to $t$ in $S$ .

To help with this, we will do a precomputation to compute $n(v)$ for each vertex $v$ in $S$ , where $n(v)$ counts the number of distinct paths from $v$ to $t$ . This precomputation can be done in linear time by scanning the vertices of $S$ in topologically sorted order, using the following recurrence relation:

n (v) = \sum_{w \in succ (v)} n (w)

$n(v) = \sum_{w \in \text{succ}(v)} n(w)$

where $\text{succ}(v)$ denotes the successors of $v$ , i.e., $\text{succ}(v) = \{w : v \to w \text{ is an edge in $S$}\}$ , and where we have the base case $n(t)=1$ .

Next, we use the $n(\cdot)$ annotation to sample a random path. We first visit node $s$ . Then, we randomly choose one of the successors of $s$ , with successor $w$ weighted by $n(w)$ . In other words:

choosesuccessor(v):
    n = 0
    for each w in succ(w):
        n = n + n(w)
    r = a random integer between 0 and n-1
    n = 0
    for each w in succ(w):
        n = n + n(w)
        if r < n:
            return w

To choose a random path, we repeatedly iterate this process: i.e., $v_0=s$ , and $v_{i+1} =$ choosesuccessor $(v_i)$ . The resulting path is the desired path, and it will be sampled uniformly at random from all shortest paths from $s$ to $t$ .

Hopefully this helps you understand Realz Slaw's solution more easily. All credit to Realz Slaw for the beautiful and clean solution to this problem!

The one case this doesn't handle is the case where some edges have weight 0 or negative weight. However, the problem is potentially not well-defined in that case, as you can have infinitely many shortest paths.

— D.W.
fonte

Glad you took the time to fully get my answer; I wasn't sure it is correct. Now I am vindicated :D.

— Realz Slaw