Quali sono alcune tecniche per campionare due variabili casuali correlate?


16

Quali sono alcune tecniche per campionare due variabili casuali correlate:

  • se le loro distribuzioni di probabilità sono parametrizzate (ad es. log-normale)

  • se hanno distribuzioni non parametriche.

I dati sono due serie temporali per le quali possiamo calcolare coefficienti di correlazione diversi da zero. Desideriamo simulare questi dati in futuro, supponendo che la correlazione storica e le serie storiche CDF siano costanti.

Per il caso (2), l'analogo 1-D sarebbe quello di costruire il CDF e campionarlo da esso. Quindi immagino che potrei costruire un CDF 2-D e fare la stessa cosa. Tuttavia, mi chiedo se c'è un modo per avvicinarsi usando i singoli CDF 1-D e collegando in qualche modo le scelte.

Grazie!


3
Collegamento 1-D CDF mi fa pensare di copula s. Non sono sicuro che ti possano essere utili.
onestop il

Risposte:


23

Penso che quello che stai cercando sia una copula. Hai due distribuzioni marginali (specificate da cdfs parametrici o empirici) e ora vuoi specificare la dipendenza tra i due. Per il caso bivariato ci sono tutti i tipi di scelte, ma la ricetta di base è la stessa. Userò una copula gaussiana per facilitare l'interpretazione.

Trarre dalla copula gaussiana con matrice di correlazione C

  1. Disegna (Z=(Z1,Z2)~N(0,C)

  2. Impostare per i = 1 , 2 (con Φ il normale cdf normale). Ora U 1 , U 2U [ 0 , 1 ] , ma sono dipendenti.Uio=Φ(Zio)io=1,2ΦU1,U2~U[0,1]

  3. Impostare dove F - 1 i è l'inverso (pseudo) del cdf marginale per la variabile i . Ciò implica che Y i seguono la distribuzione desiderata (questo passaggio è solo metodo dell'inversione).Yio=Fio-1(Uio)Fio-1ioYio

Ecco! Provalo per alcuni casi semplici e guarda istogrammi e scatterpolot marginali, è divertente.

Nessuna garanzia che ciò sia appropriato per la tua particolare applicazione (in particolare, potrebbe essere necessario sostituire la copula gaussiana con copula) ma questo dovrebbe iniziare. Un buon riferimento alla modellazione della copula è Nelsen (1999), An Introduction to Copulas , ma ci sono anche delle ottime introduzioni online.


2
+1 Nelsen è abbastanza leggibile. Ne ho comprato una copia qualche anno fa, anche dopo aver esaminato molti dei materiali online.
whuber

1
Ho trovato un ottimo tutorial e un foglio di calcolo di accompagnamento: behan.ws/copula.pdf e soa.org/files/xls/rsrch-copula-ex.xls
Pete

1
@Pete, il documento è davvero carino. Il link del foglio di calcolo, d'altra parte, è morto
Boris Gorelik,

Sembra che le recenti versioni di Mathematica e Matlab abbiano già funzioni integrate per gestire questo problema?
LCFactorization

cosa fare se voglio fare lo stesso con una copula plackett? esiste una relazione tra normale e copula plackett?
fedvasu,

2

X1~Y+ZX2~W+ZZU(1-U)

Un terzo metodo popolare è (NORTA) NORmal To Anything ; generare variate normali correlate, trasformarle in variate casuali uniformi valutando i rispettivi cdf, quindi utilizzare queste "nuove" variate casuali uniformi come fonte di casualità nella generazione di disegni dalla nuova distribuzione.

Oltre all'approccio copula (un'intera classe di metodi) menzionato in un altro post, puoi anche campionare dalla massima distribuzione di accoppiamento che è simile nello spirito all'approccio copula. Specificate le distribuzioni marginali e il campione dall'accoppiamento massimo. Ciò viene realizzato con 2 passaggi di accettazione-rifiuto come descritto da Pierre Jacob qui . Presumibilmente questo metodo può essere esteso a dimensioni superiori a 2 ma potrebbe essere più complicato da raggiungere. Si noti che l'accoppiamento massimo indurrà una correlazione che dipende dai valori dei parametri dei marginali. Vedi questo post per un bell'esempio di questo nella risposta di Xi'an alla mia domanda.

Se si desidera accettare campioni approssimativi (nella maggior parte dei casi), le tecniche MCMC sono anche un'opzione per campionare da distribuzioni multidimensionali.

Inoltre, è possibile utilizzare metodi di accettazione-rifiuto , ma in genere è difficile trovare una densità dominante da cui campionare e valutare il rapporto tra quella e la densità desiderata.

Questi sono tutti i metodi aggiuntivi a cui riesco a pensare ma probabilmente ce ne sono un paio che mi sono perso.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.