Da una risposta in una domanda precedente , sono stato indirizzato verso la sequenza di Halton, per aver creato una serie di vettori che coprivano uno spazio campione uniformemente uniformemente. Ma la pagina di Wikipedia menziona che i numeri primi più alti sono spesso altamente correlati all'inizio della serie. Questo sembra essere il caso di qualsiasi coppia di numeri primi alti con una dimensione del campione relativamente breve - e anche quando le variabili non sono correlate, lo spazio del campione non è uniformemente campionato, piuttosto ci sono bande diagonali di alta densità del campione attraverso lo spazio .
Dato che sto usando vettori di lunghezza 6 o superiore, dovrò inevitabilmente usare alcuni numeri primi per i quali questo è un problema (anche se non così grave come nell'esempio riportato), e alcune coppie di variabili verranno campionate in modo non uniforme in il loro piano di campionamento. L'utilizzo della sequenza di Sobol per generare un insieme simile mi sembra (solo guardando i grafici) di generare campioni tra coppie di variabili che sono distribuite in modo molto più uniforme, anche per un numero relativamente piccolo di campioni. Questo sembra molto più utile, e quindi mi chiedo quando una sequenza di Halton sarebbe più utile? O è solo la sequenza di Halton è più facile da calcolare?
Nota: è gradita anche la discussione di altre sequenze multidimensionali a bassa discrepanza.