Lo stimatore per il coefficiente di correlazione (che nel caso di uno standard bivariato normale è uguale alla covarianza)
r~= 1nΣi = 1nXioyio
è lo stimatore del metodo dei momenti, la covarianza del campione. Vediamo se coincide con lo stimatore della massima verosimiglianza, .ρ^
La densità congiunta di uno standard bivariata normale con coefficiente di correlazione ISρ
f( x , y) = 12 π1 - ρ2-----√exp{ - x2+ y2- 2 ρ x y2 ( 1 - ρ2)}
e quindi la probabilità logaritmica di un campione iid di dimensione èn
lnL = - n ln( 2 π) - n2ln( 1 - ρ2)−12(1−ρ2)∑i=1n(x2i+y2i−2ρxiyi)
(qui l'ipotesi IID è ovviamente relativa a ciascun disegno proveniente dalla popolazione bidimensionale)
Prendendo la derivata rispetto a e impostandola uguale a zero si ottiene un polinomio di grado 3d in :ρρρ
ρ^: n ρ^3- ( ∑i = 1nXioyio) ρ^2- ( 1 - 1nΣi = 1n( x2io+ y2io) ) n ρ^- ∑i = 1nXioyio= 0
Che i calcoli siano corretti può essere verificato se si prende il valore atteso della derivata valutato al coefficiente reale -it sarà uguale a zero.ρ
Per compattezza, scrittura , che è la somma del campione varianze di e . Se dividiamo l'espressione della 1a derivata per apparirà lo stimatore MoM, in particolare X Y n( 1 / n ) ∑ni = 1( x2io+ y2io) = ( 1 / n ) S2XYn
ρ^: ρ^3- r~ρ^2+ [ ( 1 / n ) S2- 1 ] ρ^- r~= 0
⇒ ρ^( ρ^2- r~ρ^+ [ ( 1 / n ) S2−1])=r~
Facendo l'algebra, non è difficile concludere che otterremo se, e solo se, , cioè solo se accade che la somma delle varianze del campione sia uguale la somma delle variazioni reali. Quindi in generale (1/n)S2=2ρ^=r~(1/n)S2=2
ρ^≠r~
Quindi cosa succede qui? Qualcuno più saggio lo spiegherà, per il momento, proviamo una simulazione: ho generato un campione iid di due normali standard con coefficiente di correlazione . La dimensione del campione era . I valori del campione eranon = 1.000ρ=0.6n=1.000
∑i=1nxiyi=522.05,S2=1913.28
Lo stimatore del metodo dei momenti ci dà
r~=522.051000=0.522
Cosa succede con la verosimiglianza? Visivamente, abbiamo
Numericamente, abbiamo
ρ0.50.510.520.530.540.550.560.570.580.590.61st deriv−70.92−59.41−47.7−35.78−23.64−11.291.2914.127.1540.4453.98lnL−783.65−782.47−781.48−780.68−780.1−779.75−779.64−779.81−780.27−781.05−782.18
e vediamo che la probabilità logaritmica ha un massimo un po 'prima di dove anche la prima derivata diventa zero . Nessuna sorpresa per i valori di non mostrati. Inoltre, la prima derivata non ha altra radice.( ρ = 0,558,985 mila ) ρρ=0.56(ρ^=0.558985)ρ
Quindi questa simulazione concorda con il risultato che lo stimatore della massima verosimiglianza non eguaglia il metodo dello stimatore dei momenti (che è la covarianza del campione tra i due camper).
Ma sembra che "tutti" stiano dicendo che dovrebbe ... quindi qualcuno dovrebbe trovare una spiegazione.
AGGIORNARE
Un riferimento che dimostra che il MLE è lo stimatore del metodo dei momenti: Anderson, TW, & Olkin, I. (1985). Stima della massima verosimiglianza dei parametri di una distribuzione normale multivariata. Algebra lineare e sue applicazioni, 70, 147-171.
Importa che qui tutti i mezzi e le varianze sono liberi di variare e non fissati?
... Probabilmente sì, perché il commento di @ guy in un'altra risposta (ora eliminata) dice che, con determinati parametri di media e varianza, la normale bivariata diventa un membro della famiglia esponenziale curva (e quindi alcuni risultati e proprietà cambiano) ... che sembra essere l'unico modo per conciliare i due risultati.