Cos'è l'identificabilità del modello?


38

So che con un modello non identificabile si può dire che i dati sono generati da più assegnazioni diverse ai parametri del modello. So che a volte è possibile vincolare i parametri in modo che tutti siano identificabili, come nell'esempio in Cassella & Berger 2nd ed, sezione 11.2.

Dato un modello particolare, come posso valutare se è identificabile o no?

Risposte:


46

Per identificabilità stiamo parlando di un parametro (che potrebbe essere un vettore), che spazia su uno spazio parametrico Θ , e una famiglia di distribuzioni (per semplicità, pensa PDF) indicizzato da θ che abbiamo qualcosa di tipicamente scrivere come { f θ |θΘθ . Ad esempio, θ potrebbe essere θ = β e f potrebbe essere{fθ|θΘ}θθ=βf

che significherebbe cheΘ=(0,). Affinché il modello sia identificabile, la trasformazione che mappa daθafθdovrebbe essereuno a uno. Dato un modello nel tuo giro, il modo più semplice per verificarlo è iniziare con l'equazionefθ 1 =fθ 2 , (questa uguaglianza dovrebbe valere per (quasi) tutte lexnel

fθ(x)=1βex/β, x>0, β>0,
Θ=(0,)θfθfθ1=fθ2xsupporto ) e provare a usare l'algebra (o qualche altro argomento) per dimostrare che proprio una tale equazione implica che, in realtà, .θ1=θ2

Se hai successo con questo piano, allora il tuo modello è identificabile; vai avanti con i tuoi affari. In caso contrario, il tuo modello non è identificabile o devi trovare un altro argomento. L'intuizione è la stessa, a prescindere: in un modello identificabile è impossibile per due parametri distinti (che potrebbero essere vettori) dare origine alla stessa funzione di probabilità.

Ciò ha senso, perché se, per i dati fissi, due parametri univoci generassero la stessa probabilità, sarebbe impossibile distinguere tra i due parametri candidati in base ai soli dati. In questo caso sarebbe impossibile identificare il parametro vero.

Per l'esempio sopra, l'equazione è 1fθ1=fθ2 per (quasi) tuttix>0. Se prendiamo tronchi di entrambe le parti otteniamo -ln

1β1ex/β1=1β2ex/β2,
x>0 perx>0, che implica la funzione lineare -(1
lnβ1xβ1=lnβ2xβ2
x>0 è (quasi) identicamente zero. L'unica linea che fa una cosa del genere è quella che ha l'inclinazione 0 e l'intercetta y zero. Spero che tu possa vedere il resto.
(1β11β2)x(lnβ1lnβ2)

A proposito, se riesci a capire guardando il tuo modello che non è identificabile (a volte puoi), allora è comune introdurre ulteriori vincoli su di esso per renderlo identificabile (come hai detto). Questo è simile al riconoscere che la funzione non è uno a uno per y in [ - 1 , 1 ] , ma è uno a uno se limitiamo y a mentire dentro [ 0 , 1 ] . Nei modelli più complicati le equazioni sono più difficili ma l'idea è la stessa.f(y)=y2y[1,1]y[0,1]


2
(+1) Spiegazione piacevole, completa e concreta. Le analogie che tracciate rendono chiari i concetti.
cardinale il

Hai sicuramente risposto alla domanda che ho posto, ma sono troppo alle prime armi per capire davvero la tua risposta. Se conosci una spiegazione migliore per un principiante, per favore fammi sapere.
Jack Tanner il

1
@ cardinale, grazie. A Jack, va bene, capisco. Che ne dici di questo: se c'è qualcosa sopra che non è ancora chiaro, e se me lo fai notare, allora posso provare a perfezionarlo un po 'di più. Oppure, se preferisci, potresti scrivere un'altra domanda che richiede una spiegazione da "profano" o esempi di queste idee. Penso che sia giusto dire che l'identificabilità è un argomento che di solito emerge dopo il tipico periodo introduttivo di studio, quindi se desideri fornire un contesto del motivo per cui stai incontrando questo ora, potrebbe aiutare i potenziali rispondenti.

2
yij=μ+α1+α2++αk+εi

23

ΣΣΣ

Σ

Se stai riscontrando un problema di massima probabilità, allora sai che la matrice di covarianza asintotica delle tue stime è uguale all'inverso delle informazioni sul pescatore valutate al MLE. Quindi, controllare la matrice di informazioni sul pescatore per singolarità (approssimativa) è anche un modo ragionevole per valutare l'identificabilità. Ciò funziona anche laddove le informazioni teoriche sul pescatore sono difficili da calcolare perché è spesso possibile approssimare in modo molto accurato numericamente uno stimatore coerente della matrice di informazioni sul pescatore, ad esempio stimando il prodotto esterno atteso della funzione di punteggio dal prodotto esterno medio osservato .

Σ


2
(+1) Ben fatto. Non avevo nemmeno pensato di affrontare questa domanda da quella direzione.

1
Uno dei motivi per cui l'idea di calcolare una matrice di covarianza basata su dati simulati è particolarmente chiara, è che si dovrebbero simulare comunque i dati per eseguire un controllo Cook-Gelman-Rubin .
Jack Tanner il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.