Perché LKJcorr è un buon precedente per la matrice di correlazione?


11

Sto leggendo il capitolo 13 "Adventures in Covariance" nel ( superbo ) libro Statistical Rethinking di Richard McElreath dove presenta il seguente modello gerarchico:

Modello

( Rè una matrice di correlazione)

L'autore spiega che LKJcorrè un precedente debolmente informativo che funziona come un precedente regolarizzante per la matrice di correlazione. Ma perché è così? Quali caratteristiche ha la LKJcorrdistribuzione che lo rendono un ottimo precedente per le matrici di correlazione? Quali sono gli altri buoni priori usati nella pratica per le matrici di correlazione?

Risposte:


8

La distribuzione di LKJ è un'estensione del lavoro di H. Joe (1). Joe ha proposto una procedura per generare matrici di correlazione uniformemente nello spazio di tutte le matrici di correlazione definite positive. Il contributo di (2) è che estende il lavoro di Joe per dimostrare che esiste un modo più efficiente di generare tali campioni.

La parametrizzazione comunemente utilizzata in software come Stan consente di controllare la precisione con cui le matrici campionate assomigliano alle matrici di identità. Ciò significa che è possibile passare agevolmente da matrici di campionamento che sono quasi tutte a matrici che sono più o meno uniformi rispetto alle matrici PD.io

Un metodo alternativo di campionamento da matrici di correlazione, chiamato metodo "a cipolla", si trova in (3). (Probabilmente nessun rapporto con la rivista satirica).

Un'altra alternativa è campionare dalle distribuzioni di Wishart, che sono semi-definite positive, e quindi dividere le varianze per lasciare una matrice di correlazione. Il problema con le distribuzioni di tipo Wishart è che le varietà non informative sono singolari o numericamente singolari con alta probabilità, quindi i metodi di campionamento sono lenti quando è richiesto che il campione sia (numerico) non singolare.

(1) H. Joe. "Generazione di matrici di correlazione casuali basate su correlazioni parziali." Journal of Multivariate Analysis , 97 (2006), pagg. 2177-2189

(2) Daniel Lewandowski, Dorota Kurowicka, Harry Joe. "Generazione di matrici di correlazione casuali basate su viti e metodo esteso della cipolla." Journal of Multivariate Analysis , Volume 100, Numero 9, 2009, Pagine 1989-2001

(3) S. Ghosh, SG Henderson. "Comportamento del metodo norta per la generazione vettoriale casuale correlata all'aumentare della dimensione." ACM Transactions on Modeling and Computer Simulation (TOMACS), 13 (3) (2003), pagg. 276-294

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.