Generazione di input per algoritmi grafici con test casuali?

Quando si testano gli algoritmi, un approccio comune è il test casuale: generare un numero significativo di input secondo una certa distribuzione (di solito uniforme), eseguire l'algoritmo su di essi e verificare la correttezza. I moderni framework di test possono generare input automaticamente data la firma degli algoritmi, con alcune restrizioni.

Se gli input sono numeri, elenchi o stringhe, generano tali input in modo diretto. Gli alberi sono più difficili, ma comunque facili (usando grammatiche stocastiche senza contesto o approcci simili).

Come è possibile generare grafici casuali (in modo efficiente)? Di solito, scegliere i grafici in modo uniforme a caso non è quello che vuoi: dovrebbero essere collegati, o planari o liberi da cicli, o soddisfare qualsiasi altra proprietà. Il campionamento del rifiuto sembra non ottimale, a causa della serie potenzialmente enorme di grafici indesiderati.

Quali sono le distribuzioni utili da guardare? Utile qui significa che

è probabile che i grafici testino bene l'algoritmo e
possono essere generati in modo efficace ed efficiente.

So che ci sono molti modelli per grafici casuali, quindi apprezzerei alcune intuizioni su quali siano le migliori per la generazione di grafici in questo senso.

Se "alcuni algoritmi" sono troppo generici, utilizzare gli algoritmi di ricerca del percorso più breve come una classe concreta di algoritmi sotto test. I grafici per i test dovrebbero essere collegati e piuttosto densi (con alta probabilità, o almeno in aspettativa). Per i test, la soluzione ottimale sarebbe quella di creare grafici casuali attorno a un percorso più breve in modo da conoscere il risultato desiderato (senza dover utilizzare un altro algoritmo).

— Raffaello
fonte

Questa domanda è stata suscitata da quella .

— Raffaello

Grafici casuali con topologia mondiale di piccole dimensioni

Nei grafici con topologia mondiale piccola , i nodi sono altamente raggruppati, ma la lunghezza del percorso tra loro è piccola. Una topologia come questa può rendere molto difficili i problemi di ricerca, poiché le decisioni locali si propagano rapidamente a livello globale. In altre parole, le scorciatoie possono fuorviare l'euristica. Inoltre è stato dimostrato che molti diversi problemi di ricerca hanno una piccola topologia mondiale.

Watts e Strogatz [1] propongono un modello per piccoli grafici mondiali . Innanzitutto, iniziamo con un grafico normale. Il disordine viene introdotto nel grafico ricablando casualmente ogni fronte con probabilità . Se , il grafico è completamente regolare e ordinato. Se , il grafico è completamente casuale e disordinato. I valori di producono grafici che non sono né completamente regolari né completamente disordinati. I grafici non hanno una topologia mondiale piccola per e . $p$ $p=0$ $p=1$ $0 < p < 1$ $p=0$ $p=1$

Watts e Strogatz partono da un reticolo ad anello con nodi e vicini più vicini. Un nodo viene scelto dal reticolo uniformemente a caso e un bordo ricollegato viene ricollegato ad esso. Se il ricablaggio crea un bordo duplicato, non viene toccato. Per i grafici grandi e sparsi richiedono , dove garantisce che il grafico rimanga connesso. $n$ $k$ $n \gg k \gg \ln(n) \gg 1$ $k \gg \ln(n)$

Il modello di Watts e Strogatz è piuttosto popolare, ma presenta alcuni inconvenienti. Walsh [2] indaga gli effetti della randomizzazione e delle strategie di riavvio nei grafici generati usando il modello. C'è anche un articolo di Virtanen [3], che copre altri modelli motivati dalla necessità di una modellazione realistica di sistemi complessi.

Grafici planari semplici casuali

La generazione di grafici planari semplici casuali su vertici uniformemente a caso può essere eseguita in modo efficiente. Il numero di grafici planari con vertici, , può essere determinato usando le funzioni di generazione. Il valore di per è rispettivamente e . Poiché i numeri sono troppo complicati, non ci si aspetta che trovino una formula chiusa per loro. Giménez e Noy [4] forniscono una stima asintotica precisa per la crescita di : dove e $n$ $n$ $g_n$ $g_n$ $1 \leq n \leq 9$ $1,2,8,64,1023,32071,1823707,163947848$ $20402420291$ $g_n$

g_{n} ~ g \cdot n^{- 7 / 2} γ^{n} n!,

$g_n \sim g \cdot n^{-7/2} \gamma^n n!,$

g

$g$

γ

$\gamma$ sono costanti determinate analiticamente con valori approssimativi e .

g \approx 0.42609

$g \approx 0.42609$

γ \approx 27.22687

$\gamma \approx 27.22687$

La prova del risultato porta a un algoritmo molto efficiente di Fusy [5]. Fusy fornisce un generatore casuale di dimensioni approssimative e anche un generatore casuale di dimensioni esatte di grafici planari. L'algoritmo di dimensione approssimativa viene eseguito in tempo lineare mentre l'algoritmo di dimensione esatta viene eseguito in tempo quadratico. Gli algoritmi si basano sulla decomposizione in base ai livelli successivi di connettività: grafico planare connesso 2-connesso 3-connesso albero binario. $\rightarrow$ $\rightarrow$ $\rightarrow$ $\rightarrow$

Gli algoritmi funzionano quindi traducendo una decomposizione di un grafico planare in un generatore casuale usando il framework dei campionatori Boltzmann di Duchon, Flajolet, Louchard e Schaeffer [6]. Data una classe combinatoria, un campionatore di Boltzmann disegna un oggetto di dimensione con probabilità su , dove è un parametro reale sintonizzato dall'utente. Inoltre, la distribuzione della probabilità è distribuita su tutti gli oggetti della classe, con la proprietà che gli oggetti della stessa dimensione hanno la stessa probabilità di verificarsi. Inoltre, la distribuzione della probabilità è uniforme quando limitata a una dimensione fissa. $n$ $x^n$ $x$