Qual è la normale approssimazione della distribuzione multinomiale?


Risposte:


21

È possibile approssimarlo con la distribuzione normale multivariata allo stesso modo in cui la distribuzione binomiale è approssimata dalla distribuzione normale univariata. Controlla gli elementi della teoria della distribuzione e della distribuzione multinomiale pagine 15-16-17.

Lascia che sia il vettore delle tue probabilità. Quindi il vettore medio della distribuzione normale multivariata è . La matrice di covarianza è una matrice simmetrica . Gli elementi diagonali sono in realtà la varianza di ; cioè , . L'elemento off-diagonale nella riga con la riga e jth è , dove non è uguale a .n p = ( n p 1 , n p 2 , . . . , N p k ) k × k X i n p i ( 1 - p i ) i = 1 , 2 ... , k Cov ( X i , X jP=(p1,...,pk)np=(np1,np2,...,npk)k×kXinpi(1pi)i=1,2...,kCov(Xi,Xj)=npipjij


1
Dai un'occhiata al secondo riferimento.
Stat

3
Stat, in modo che questa risposta possa resistere da sola (ed essere resistente al marciume di collegamento), ti dispiacerebbe dare un riassunto della soluzione?
whuber

4
È necessaria una correzione della continuità? Come lo applicheresti?
Jack Aidley,

2
La matrice di covarianza non è definita positiva, ma semi-definita positiva, e non è di rango pieno. Ciò rende indefinita la distribuzione multinormale risultante. Questo è il problema che ho affrontato. Qualche idea su come gestirlo?
Mohammad Alaggan,

2
@ M.Alaggan: le matrici media / covarianza definite qui hanno un problema minore: per una distribuzione multinomiale con variabili, la normale multivariata equivalente ha variate. Ciò è evidente nel semplice esempio binomiale, che è approssimativo per la (normale) distribuzione normale. Per ulteriori discussioni, vedi Esempio 12.7 di Elements of Distribution Theory . k - 1KK-1
MS Dousti,

1

La densità data in questa risposta è degenerata, e quindi ho usato quanto segue per calcolare la densità che risulta dall'approssimazione normale:

C'è un teorema che dice dato una variabile casuale X=[X1,,Xm]TMultinom(n,p) , per un m -dimensionale vettore p con ipi=1 e iXi=n , quello;

Xdndiag(u)Q[Z1Zm-10]+[np1npm],

per n grande , dato;

  • un vettore u con uio=pio ;
  • variabili casuali Zio~N(0,1) per io=1,...,m-1 e;
  • una matrice ortogonale Q con colonna finale u .

Vale a dire, con qualche riarrangiamento, possiamo elaborare una distribuzione normale multivariata m-1 per i primi componenti m-1 di X (che sono gli unici componenti interessanti perché Xm è la somma degli altri).

Un valore adatto della matrice Q è io-2vvT con vio=(δiom-uio)/2(1-um) - ovvero una particolare trasformazione della famiglia.

Se limitiamo il lato sinistro della prima m-1 righe e limitare Q al suo primo m-1 righe e m-1 colonne (denotare questi X e Q rispettivamente) allora:X^Q^

X^dndiag(u^)Q^[Z1Zm-1]+[np1npm-1]~N(μ,nΣ),

per n grande , dove;

  • u^ denota il primom-1termini diu;
  • la media è μ=[np1,...,npm-1]T , e;
  • la matrice di covarianza nΣ=nUNUNT con UN=diag(u^)Q^ .

Il lato destro dell'equazione finale è la densità non degenerata utilizzata nel calcolo.

Come previsto, quando si collega tutto, si ottiene la seguente matrice di covarianza:

(nΣ)ioj=npiopj(δioj-piopj)

per io,j=1,...,m-1 , che è esattamente la matrice di covarianza nella risposta originale limitata alle sue prime m-1 righe e m-1 colonne.

Questo post sul blog è stato il mio punto di partenza.


1
Un'altra utile risorsa sono i link forniti in: stats.stackexchange.com/questions/2397/…
stephematician

1
Buona risposta (+1) --- Si noti che è possibile incorporare collegamenti con la sintassi [textual description](hyperlink). Mi sono preso la libertà di modificare questa risposta per incorporare i tuoi link.
Ben - Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.