Qual è la stima della massima verosimiglianza della covarianza dei dati normali bivariati quando si conoscono media e varianza?


10

Supponiamo di avere un campione casuale da una distribuzione normale bivariata che ha zero come mezzo e uno come varianza, quindi l'unico parametro sconosciuto è la covarianza. Qual è il MLE della covarianza? So che dovrebbe essere qualcosa come ma come facciamo a saperlo?1nΣj=1nXjyj


1
Come antipasto, non pensi che sia un po 'irriverente stimare i mezzi con e quando in realtà sappiamo che sono 0 e 0? X¯y¯
Wolfgang,

Molto zio, risolto. Ancora non vedo come questo può facilmente seguire. È analogo alla varianza del campione, ma perché è il MLE (a meno che non lo sia e non ho fatto un altro errore)
Stacy

Hai cancellato 1nΣio=1n(Xio-X¯)(yio-y¯)? Prendendo questa formula non significa che si consideraecome le stime dei mezzi. X¯y¯
Stéphane Laurent,

@ StéphaneLaurent Sì, nel post iniziale, la formula è stata data come l'hai scritta.
Wolfgang,

Risposte:


11

Lo stimatore per il coefficiente di correlazione (che nel caso di uno standard bivariato normale è uguale alla covarianza)

r~=1nΣio=1nXioyio

è lo stimatore del metodo dei momenti, la covarianza del campione. Vediamo se coincide con lo stimatore della massima verosimiglianza, .ρ^

La densità congiunta di uno standard bivariata normale con coefficiente di correlazione ISρ

f(X,y)=12π1-ρ2exp{-X2+y2-2ρXy2(1-ρ2)}

e quindi la probabilità logaritmica di un campione iid di dimensione èn

lnL=nln(2π)n2ln(1ρ2)12(1ρ2)i=1n(xi2+yi22ρxiyi)

(qui l'ipotesi IID è ovviamente relativa a ciascun disegno proveniente dalla popolazione bidimensionale)

Prendendo la derivata rispetto a e impostandola uguale a zero si ottiene un polinomio di grado 3d in :ρρρ

ρ^:nρ^3-(Σio=1nXioyio)ρ^2-(1-1nΣio=1n(Xio2+yio2))nρ^-Σio=1nXioyio=0

Che i calcoli siano corretti può essere verificato se si prende il valore atteso della derivata valutato al coefficiente reale -it sarà uguale a zero.ρ

Per compattezza, scrittura , che è la somma del campione varianze di e . Se dividiamo l'espressione della 1a derivata per apparirà lo stimatore MoM, in particolare X Y n(1/n)Σio=1n(Xio2+yio2)=(1/n)S2XYn

ρ^:ρ^3-r~ρ^2+[(1/n)S2-1]ρ^-r~=0

ρ^(ρ^2r~ρ^+[(1/n)S21])=r~

Facendo l'algebra, non è difficile concludere che otterremo se, e solo se, , cioè solo se accade che la somma delle varianze del campione sia uguale la somma delle variazioni reali. Quindi in generale (1/n)S2=2ρ^=r~(1/n)S2=2

ρ^r~

Quindi cosa succede qui? Qualcuno più saggio lo spiegherà, per il momento, proviamo una simulazione: ho generato un campione iid di due normali standard con coefficiente di correlazione . La dimensione del campione era . I valori del campione eranon = 1.000ρ=0.6n=1.000

i=1nxiyi=522.05,S2=1913.28

Lo stimatore del metodo dei momenti ci dà

r~=522.051000=0.522

Cosa succede con la verosimiglianza? Visivamente, abbiamo

inserisci qui la descrizione dell'immagine

Numericamente, abbiamo

ρ1st derivlnL0.570.92783.650.5159.41782.470.5247.7781.480.5335.78780.680.5423.64780.10.5511.29779.750.561.29779.640.5714.1779.810.5827.15780.270.5940.44781.050.653.98782.18

e vediamo che la probabilità logaritmica ha un massimo un po 'prima di dove anche la prima derivata diventa zero . Nessuna sorpresa per i valori di non mostrati. Inoltre, la prima derivata non ha altra radice.( ρ = 0,558,985 mila ) ρρ=0.56(ρ^=0.558985)ρ

Quindi questa simulazione concorda con il risultato che lo stimatore della massima verosimiglianza non eguaglia il metodo dello stimatore dei momenti (che è la covarianza del campione tra i due camper).

Ma sembra che "tutti" stiano dicendo che dovrebbe ... quindi qualcuno dovrebbe trovare una spiegazione.

AGGIORNARE

Un riferimento che dimostra che il MLE è lo stimatore del metodo dei momenti: Anderson, TW, & Olkin, I. (1985). Stima della massima verosimiglianza dei parametri di una distribuzione normale multivariata. Algebra lineare e sue applicazioni, 70, 147-171.
Importa che qui tutti i mezzi e le varianze sono liberi di variare e non fissati?

... Probabilmente sì, perché il commento di @ guy in un'altra risposta (ora eliminata) dice che, con determinati parametri di media e varianza, la normale bivariata diventa un membro della famiglia esponenziale curva (e quindi alcuni risultati e proprietà cambiano) ... che sembra essere l'unico modo per conciliare i due risultati.


1
Questo è un po 'sorprendente, ma dopo qualche riflessione dovrebbe essere previsto. Il problema può essere riformulato come stima del coefficiente di regressione nel modello dove . Questo non è un modello lineare, quindi non c'è motivo di aspettarsi che l'MLE sia un semplice prodotto a punti. La stessa logica mostra (penso!) Che se conosciamo solo allora l'MLE è e se conosciamo solo . Se non conosciamo nessuno dei due, otteniamo il tuo stimatore MOM. Y = ρ X + ϵ ϵ N ( 0 , ρY=ρX+ϵVar(X)xy/xxxy/yyVar(Y)ϵN(0,1ρ22)Var(X)xy/xxxy/yyVar(Y)
ragazzo

1
@guy: molto interessante. Penso che questi argomenti, se leggermente ampliati, meritino pienamente di essere pubblicati come una risposta separata!
amoeba,

@guy Non penso che questa formulazione sia equivalente, perché la probabilità logaritmica nella configurazione di regressione contiene il quadrato . Il coefficiente attaccato a non è presente nella formulazione della densità bivariata. ρ 2 x 2ε2=(y-ρX)2=y2-2ρXy+ρ2X2ρ2X2
Alecos Papadopoulos,

La mia ipotesi è . Immagina e , quindi è prevista una stima . n=2y1=y201nΣio=1n(Xio-X¯)(yio-y¯)n=2y1=y20
Stéphane Laurent,

1
@AlecosPapadopoulos . Il termine è cancellato dal denominatore , quindi l'unico termine dai dati che contribuisce alla tua verosimiglianza originale è . Ma questo è anche immediato dalla nota fattorizzazione , . Le mie altre affermazioni sono errate, poiché ho trascurato di includere il termine in esse. ( 1 - ρ 2 ) x 2 ( 1 - ρ 2 ) ( y - ρ x ) 2 / ( 1 - ρ 2 ) X N ( μ XX2+y2-2ρXy=(1-ρ2)X2+(y-ρX)2(1-ρ2)X2(1-ρ2)(y-ρX)2/(1-ρ2)[ Y | X ] N ( μ Y + ρ X σ YX~N(μX,σX2)σY/σX[Y|X]~N(μY+ρXσYσX(X-μX),σY|X21-ρ22)σY/σX
ragazzo

2

Nelle condizioni indicate ( e ), la funzione di probabilità per un campione casuale di dimensione èσ X = σ Y = 1 n L ( ρμX=μY=0σX=σY=1n

L(ρ|X,Y)=1(2π[1-ρ2])n/2exp[-12(1-ρ2)(X'X-2ρX'Y+Y'Y)].

Ora trova la verosimiglianza e prendi la derivata rispetto a . Quindi, impostalo uguale a 0, risolvendo per . Ovviamente dovresti fare alcuni test appropriati per mostrare che quello che hai trovato è in realtà un massimo globale.ρρ^

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.