Sia i dati osservati che si presume siano la realizzazione di una sequenza di variabili casuali iid con funzione di densità di probabilità comune definita rispetto a una misura sigma-finita . La densità è chiamata densità DGP (Data Generating Process).y1,…,ynY1,…,Ynpeνpe
Nel modello di probabilità del ricercatore
è una raccolta di funzioni di densità di probabilità che sono indicizzate da un vettore di parametri
. Supponiamo che ogni densità in sia definita rispetto ad una comune misura sigma-finita (ad esempio, ogni densità potrebbe essere una funzione di massa di probabilità con lo stesso spazio campione ).M≡{p(y;θ):θ∈Θ}θMνS
È importante mantenere la densità che ha effettivamente generato i dati concettualmente distinti dal modello di probabilità dei dati. Nei trattamenti statistici classici un'attenta separazione di questi concetti viene o ignorata, non fatta, o si presuppone fin dall'inizio che il modello di probabilità sia correttamente specificato.pe
Un modello M correttamente specificato rispetto a pe è definito come un modello dove pe∈M ν quasi ovunque. Quando
M è misspecified rispetto al pe Questo corrisponde al caso in cui il modello di probabilità non è specificata correttamente.
Se il modello di probabilità è correttamente specificato, allora esiste un θ∗ nello spazio dei parametri Θ tale che
pe(y)=p(y;θ∗) ν quasi ovunque. Tale vettore di parametri viene chiamato "vettore di parametri vero". Se il modello di probabilità non è specificato correttamente, il vettore dei parametri vero non esiste.
All'interno quadro modello di corretta specificazione del bianco l'obiettivo è quello di trovare il parametro di stima θ n che minimizza
ℓ n ( θ ) ≡ ( 1 / n ) Σ n i = 1 log p ( y i ; θ ) su alcune compatto spazio dei parametri Θ . Si presume che un minimizer unico rigoroso globale, θ * , del valore atteso di ℓ n on Θ si trova nella parte interna della Θθ^nℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^nΘΘ. Nel caso fortunato in cui il modello di probabilità è correttamente specificato, θ∗ può essere interpretato come il "valore del parametro vero".
Nel caso particolare in cui il modello di probabilità è specificato correttamente, allora θ n è la stima di massima verosimiglianza familiare. Se non sappiamo avere una conoscenza assoluta che il modello di probabilità sia correttamente specificato, allora θ n è chiamato a un rischio stima di quasi-massima e l'obiettivo è quello di stimare θ * . Se siamo fortunati e il modello di probabilità è correttamente specificato, la stima della probabilità quasi massima si riduce come un caso speciale alla stima della probabilità massima familiare e
θ ∗ diventa il valore del parametro vero.θ^nθ^nθ∗θ∗
La coerenza nel quadro di White (1982) corrisponde alla convergenza a θ∗ senza richiedere che θ∗ sia necessariamente il vero vettore di parametri. Nel quadro di White, non stimeremmo mai la probabilità dell'evento che gli insiemi prodotti da δ includano la VERA distribuzione P *. Invece, stimeremmo sempre la distribuzione di probabilità P ** che è la probabilità dell'evento che gli insiemi prodotti da δ includano la distribuzione specificata dalla densità
p(y;θ∗) .
Infine, alcuni commenti sulla mancata specificazione del modello. È facile trovare esempi in cui un modello non specificato è estremamente utile e molto predittivo. Ad esempio, si consideri un modello di regressione non lineare (o anche un lineare) con un termine di errore residuo gaussiano la cui varianza è estremamente piccola, ma l'errore residuo effettivo nell'ambiente non è gaussiano.
È anche facile trovare esempi in cui un modello correttamente specificato non è utile e non predittivo. Ad esempio, si consideri un modello di camminata casuale per prevedere i prezzi delle azioni che prevede che il prezzo di chiusura di domani sia una somma ponderata del prezzo di chiusura di oggi e del rumore gaussiano con una varianza estremamente ampia.
Lo scopo del framework di errata specificazione del modello non è garantire la validità del modello, ma piuttosto garantire l'affidabilità. In altre parole, assicurarsi che l'errore di campionamento associato alle stime dei parametri, agli intervalli di confidenza, ai test di ipotesi e così via sia stimato correttamente, nonostante la presenza di una piccola o grande quantità di errata specifica del modello. Le stime della verosimiglianza quasi massima sono asintoticamente normali centrate su θ∗ con uno stimatore a matrice di covarianza che dipende sia dalla prima che dalla seconda derivata della funzione di verosimiglianza negativa. Nel caso speciale in cui sei fortunato e il modello è corretto, tutte le formule si riducono al quadro statistico classico familiare in cui l'obiettivo è stimare i valori dei parametri "veri".