Per identificabilità stiamo parlando di un parametro (che potrebbe essere un vettore), che spazia su uno spazio parametrico Θ , e una famiglia di distribuzioni (per semplicità, pensa PDF) indicizzato da θ che abbiamo qualcosa di tipicamente scrivere come { f θ |θΘθ . Ad esempio, θ potrebbe essere θ = β e f potrebbe essere{fθ|θ∈Θ}θθ=βf
che significherebbe cheΘ=(0,∞). Affinché il modello sia identificabile, la trasformazione che mappa daθafθdovrebbe essereuno a uno. Dato un modello nel tuo giro, il modo più semplice per verificarlo è iniziare con l'equazionefθ 1 =fθ 2 , (questa uguaglianza dovrebbe valere per (quasi) tutte lexnel
fθ(x)=1βe−x/β, x>0, β>0,
Θ=(0,∞)θfθfθ1=fθ2xsupporto ) e provare a usare l'algebra (o qualche altro argomento) per dimostrare che proprio una tale equazione implica che, in realtà,
.
θ1=θ2
Se hai successo con questo piano, allora il tuo modello è identificabile; vai avanti con i tuoi affari. In caso contrario, il tuo modello non è identificabile o devi trovare un altro argomento. L'intuizione è la stessa, a prescindere: in un modello identificabile è impossibile per due parametri distinti (che potrebbero essere vettori) dare origine alla stessa funzione di probabilità.
Ciò ha senso, perché se, per i dati fissi, due parametri univoci generassero la stessa probabilità, sarebbe impossibile distinguere tra i due parametri candidati in base ai soli dati. In questo caso sarebbe impossibile identificare il parametro vero.
Per l'esempio sopra, l'equazione è
1fθ1=fθ2
per (quasi) tuttix>0. Se prendiamo tronchi di entrambe le parti otteniamo
-ln
1β1e−x/β1=1β2e−x/β2,
x>0
per
x>0, che implica la funzione lineare
-(1−lnβ1−xβ1=−lnβ2−xβ2
x>0
è (quasi) identicamente zero. L'unica linea che fa una cosa del genere è quella che ha l'inclinazione 0 e l'intercetta y zero. Spero che tu possa vedere il resto.
−(1β1−1β2)x−(lnβ1−lnβ2)
A proposito, se riesci a capire guardando il tuo modello che non è identificabile (a volte puoi), allora è comune introdurre ulteriori vincoli su di esso per renderlo identificabile (come hai detto). Questo è simile al riconoscere che la funzione non è uno a uno per y in [ - 1 , 1 ] , ma è uno a uno se limitiamo y a mentire dentro [ 0 , 1 ] . Nei modelli più complicati le equazioni sono più difficili ma l'idea è la stessa.f(y)=y2y[−1,1]y[0,1]