In questo documento , che riguarda il comando "imposta seme", le persone Stata discutono questioni relative all'impostazione dei semi quando generano numeri pseudo-casuali.
Un notevole "non" è "non usare in serie la sequenza di numeri naturali come semi, perché questo ha uno schema e mette in pericolo la pseudo-casualità".
Un "do" scherzosamente degno di nota solo per un quarto è quello di impostare solo un seme durante la tua vita e quindi registrare lo "stato" del processo generato alla fine di ogni esperimento, in modo che l'esperimento successivo continui al punto dove il processo si è fermato.
Ovviamente, i consigli di cui sopra dipendono dal conteggio atteso di numeri pseudo-casuali che uno genererà nella sua vita di ricerca. Forse un tornado di Mersenne coprirebbe le esigenze della vita di molti ricercatori ...
Ora, non ho molta esperienza riguardo ai PRNG in teoria o in pratica, quindi non posso discutere su questi suggerimenti: dovrebbero essere dimostrati validi o non validi su basi teoriche e statistiche matematiche rigide.
Quindi, le mie domande lo sono
1) Potete aiutarmi a spiegare o invalidare i consigli di cui sopra, oppure indicare un riferimento che affronti tali problemi?
2) Potete fornire riferimenti che offrono "migliori pratiche" nella creazione di seed?
3) Come procedete nel vostro lavoro e perché?
Come esempio per la domanda 3), supponi che per uno studio di Monte Carlo, desideri generare campioni ciascuno della dimensione e che il tuo abbia un periodo sufficientemente più grande di . Genereresti tutti i numeri pseudo-casuali con un seme o avresti l'abitudine di cambiare i semi, per esempio, per campione? (ma è solo a scopo illustrativo. Credo che valgano le risposte più generali qui).
Un thread correlato (sebbene molto più mirato) è
Set seed prima di ogni blocco di codice o una volta per progetto?
Ho la sensazione che forse questo dovrebbe essere un wiki della community, per favore, le mod decidono su quello.