Esistono due diverse situazioni tipiche per questo tipo di problemi:
i) vuoi generare un campione da una data distribuzione le cui caratteristiche di popolazione corrispondono a quelle specificate (ma a causa della variazione del campionamento, non hai le caratteristiche del campione esattamente corrispondenti).
ii) si desidera generare un campione le cui caratteristiche del campione corrispondano a quelle specificate (ma, a causa dei vincoli della corrispondenza esatta delle quantità del campione con un set di valori prespecificato, non provengono realmente dalla distribuzione desiderata).
Vuoi il secondo caso, ma lo ottieni seguendo lo stesso approccio del primo caso, con un ulteriore passaggio di standardizzazione.
Quindi, per le normali multivariate, entrambe possono essere eseguite in modo abbastanza semplice:
Con il primo caso potresti usare normali casuali senza la struttura della popolazione (come il normale standard che ha aspettativa 0 e matrice di covarianza di identità) e quindi imporlo - trasformalo per ottenere la matrice di covarianza e significa che vuoi. Se e sono la media della popolazione e la covarianza di cui hai bisogno e sono lo standard normale, calcoli , per alcune cui (ad esempio una adatta potrebbe essere ottenuta tramite decomposizione di Cholesky) . Quindi ha le caratteristiche di popolazione desiderate.Σ z y = L z + μ L L L ′ = Σ L yμΣzy= L z+ μLL L'= ΣLy
Con il secondo, devi prima trasformare le tue normali casuali per rimuovere anche la variazione casuale dalla media zero e dalla covarianza identità (rendendo la media campione zero e la covarianza campione ), quindi procedere come prima. Ma quella fase iniziale di rimozione della deviazione del campione dalla media esatta , la varianza interferisce con la distribuzione. (In piccoli campioni può essere piuttosto grave.) 0 Iion0io
Questo può essere fatto sottraendo la media campionaria di ( ) e calcolando la decomposizione di Cholesky di . Se è il fattore Cholesky sinistro, allora dovrebbe avere la media campionaria 0 e la covarianza del campione di identità. È quindi possibile calcolare e disporre di un campione con i momenti di campionamento desiderati. (A seconda di come sono definite le quantità del campione, potrebbe esserci un piccolo violino coinvolto nella moltiplicazione / divisione per fattori come , ma è abbastanza facile identificare tale esigenza.)z ∗ = z - ˉ z z ∗ L ∗ z ( 0 ) = ( L ∗ ) - 1 z ∗ y = L z ( 0 ) + μ √zz*= z- z¯z*L∗z(0)=(L∗)−1z∗y=Lz(0)+μn−1n−−−√