RV Foutz e RC Srivastava hanno esaminato la questione in dettaglio. Il loro articolo del 1977 "Le prestazioni del test del rapporto di verosimiglianza quando il modello non è corretto" contiene una dichiarazione del risultato distributivo in caso di errata specificazione insieme a un breve schizzo della prova, mentre il loro articolo del 1978 "La distribuzione asintotica del rapporto di verosimiglianza quando il modello non è corretto " contiene la dimostrazione, ma quest'ultimo è scritto in un vecchio tipo di macchina da scrivere (entrambi i documenti usano la stessa notazione, quindi è possibile combinarli nella lettura). Inoltre, per alcuni passaggi della dimostrazione fanno riferimento a un articolo di KP Roy "Una nota sulla distribuzione asintotica del rapporto di verosimiglianza" del 1957, che non sembra essere disponibile on-line, neppure con un cancello.
In caso di errata specificazione distributiva, se l'MLE è ancora coerente e asintoticamente normale (che non è sempre il caso), la statistica LR segue asintoticamente una combinazione lineare di chi-quadrati indipendenti (ciascuno con un grado di libertà)
−2lnλ→d∑i=1rciχ2i
dove . Si può vedere la "somiglianza": invece di un chi-quadrato con h - m gradi di libertà, abbiamo h - m chi-quadrati ciascuno con un grado di libertà. Ma l '"analogia" si ferma qui, perché una combinazione lineare di chi-quadrati non ha una densità di forma chiusa. Ogni chi-quadrato in scala è una gamma, ma con un parametro c i diverso che porta a un parametro di scala diverso per la gamma e la somma di tali gamme non è a forma chiusa, sebbene i suoi valori possano essere calcolati.r=h−mh−mh−mci
Per le costanti , abbiamo c 1 ≥ c 2 ≥ . . . c r ≥ 0 , e sono gli autovalori di una matrice ... quale matrice? Bene, usando la notazione degli autori, imposta Λ come Assia della verosimiglianza e C come prodotto esterno del gradiente della verosimiglianza (in termini attesi). Quindi V = Λ - 1 C ( Λ ′ ) - 1 è la matrice di varianza-covarianza asintotica dell'MLE.cic1≥c2≥...cr≥0ΛCV=Λ−1C(Λ′)−1
Quindi impostare essere il r × r blocco superiore diagonale di V . Mr×rV
Scrivi anche in forma di bloccoΛ
Λ=[Λr×rΛ2Λ′2Λ3]
e imposta ( W è il negativo del complemento di Schur di Λ ).W=−Λr×r+Λ′2Λ−13Λ2WΛ
Quindi i sono gli autovalori della matrice M W valutati ai valori reali dei parametri.ciMW
ADDENDUM
Rispondendo all'osservazione valida dell'OP nei commenti (a volte, in effetti, le domande diventano un trampolino di lancio per condividere un risultato più generale e possono essere trascurate nel processo), ecco come procede la prova di Wilks: Wilks inizia con l'articolazione distribuzione normale dell'MLE e procede a derivare l'espressione funzionale del rapporto di verosimiglianza. Fino al suo eq compreso , la prova può andare avanti anche se ipotizziamo che ci sia una mancata specificazione distributiva: come osserva il PO, i termini della matrice di covarianza della varianza saranno diversi nello scenario di errata specificazione, ma tutto ciò che Wilks fa è prendere derivati e identificare termini asintoticamente trascurabili. E così arriva all'eq. [ 9 ][9][9]dove vediamo che la statistica del rapporto di verosimiglianza, se la specifica è corretta, è solo la somma delle variabili casuali normali standard quadrato, e quindi sono distribuite come un chi-quadrato con h - m gradi di libertà: (notazione generica )h−mh−m
−2lnλ=∑i=1h−m(n−−√θ^i−θiσi)2→dχ2h−m
n−−√(θ^−θ)
So under misspecification we have something like
−2lnλ=∑i=1h−m(n−−√θ^i−θiai)2
and the best we can do is to manipulate it into
−2lnλ=∑i=1h−mσ2ia2i(n−−√θ^i−θiσi)2=∑i=1h−mσ2ia2iχ21
which is a sum of scaled chi-square r.v.'s, no longer distributed as one chi-square r.v. with h−m degrees of freedom. The reference provided by the OP is indeed a very clear exposition of this more general case that includes Wilks' result as a special case.