Premessa: questa potrebbe essere una domanda stupida. Conosco solo le dichiarazioni sulle proprietà asintotiche dell'MLE, ma non ho mai studiato le prove. Se lo facessi, forse non avrei fatto queste domande, o forse avrei realizzato che queste domande non hanno senso ... quindi per favore, andate piano con me :)
Ho visto spesso affermazioni che affermano che lo stimatore MLE dei parametri di un modello è asintoticamente normale ed efficiente. La dichiarazione è generalmente scritta come
come
dove è il numero di campioni, è l'informazione di Fisher e è il valore reale del parametro (vettore) . Ora, poiché esiste un riferimento a un modello vero, ciò significa che il risultato non sarà valido se il modello non è vero?I θ 0
Esempio: supponiamo che il modello I sia in uscita da una turbina eolica in funzione della velocità del vento più il rumore gaussiano additivoV
So che il modello è sbagliato, per almeno due motivi: 1) è davvero proporzionale alla terza potenza di e 2) l'errore non è additivo, perché ho trascurato altri predittori che non sono correlati alla velocità del vento (lo so anche che dovrebbe essere 0 perché a 0 velocità del vento non viene generata energia, ma non è rilevante qui). Supponiamo ora di avere un database infinito di dati di potenza e velocità del vento dalla mia turbina eolica. Posso disegnare tutti i campioni che voglio, di qualsiasi dimensione. Supponiamo di disegnare 1000 campioni, ciascuno delle dimensioni di 100, e calcolare \ hat {\ boldsymbol {\ beta}} _ {100} , la stima MLE di \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2)β 0(che sotto il mio modello sarebbe solo la stima OLS). Ho quindi 1000 campioni dalla distribuzione di . Posso ripetere l'esercizio con . Come , la distribuzione di dovrebbe tendere ad essere asintoticamente normale, con la media e la varianza dichiarate? O il fatto che il modello sia errato invalida questo risultato?
Il motivo per cui mi chiedo è che raramente (se mai) i modelli sono "veri" nelle applicazioni. Se le proprietà asintotiche di MLE vengono perse quando il modello non è vero, potrebbe essere logico utilizzare diversi principi di stima, che seppur meno potenti in un ambiente in cui il modello è corretto, in altri casi potrebbero funzionare meglio di MLE.
EDIT : è stato notato nei commenti che la nozione di vero modello può essere problematica. Avevo in mente la seguente definizione: data una famiglia di modelli indicata dal vettore parametro , per ogni modello della famiglia puoi sempre scrivere
semplicemente definendo come . Tuttavia, in generale l'errore non sarà ortogonale a , avrà media 0 e non avrà necessariamente la distribuzione assunta nella derivazione del modello. Se esiste un valore tale che ha queste due proprietà, così come la distribuzione presunta, direi che il modello è vero. Penso che ciò sia direttamente correlato al dire che , perché il termine di errore nella decomposizione
ha le due proprietà sopra menzionate.