Mi chiedo se la stima della massima verosimiglianza sia mai stata utilizzata nelle statistiche.
Certamente! In realtà parecchio, ma non sempre.
Ne apprendiamo il concetto, ma mi chiedo quando verrà effettivamente utilizzato.
Quando le persone hanno un modello distributivo parametrico, abbastanza spesso scelgono di usare la stima della massima verosimiglianza. Quando il modello è corretto, ci sono una serie di utili proprietà degli stimatori della massima verosimiglianza.
Per un esempio, l'uso di modelli lineari generalizzati è piuttosto diffuso e in tal caso i parametri che descrivono la media sono stimati con la massima probabilità.
Può accadere che alcuni parametri siano stimati con la massima probabilità e altri no. Ad esempio, si consideri un GLM di Poisson sovradisperso: il parametro di dispersione non verrà stimato con la massima probabilità, poiché in questo caso l'MLE non è utile.
Se assumiamo la distribuzione dei dati, troviamo due parametri
Bene, a volte potresti averne due, ma a volte hai un parametro, a volte tre o quattro o più.
uno per la media e uno per la varianza,
Stai forse pensando a un modello particolare? Questo non è sempre il caso. Prendi in considerazione la stima del parametro di una distribuzione esponenziale o di una distribuzione di Poisson o di una distribuzione binomiale. In ognuno di questi casi, c'è un parametro e la varianza è una funzione del parametro che descrive la media.
Oppure considera una distribuzione gamma generalizzata , che ha tre parametri. O una distribuzione beta a quattro parametri , che ha (forse non sorprendentemente) quattro parametri. Si noti inoltre che (a seconda della particolare parametrizzazione) la media o la varianza o entrambe potrebbero non essere rappresentate da un singolo parametro ma dalle funzioni di molti di essi.
Ad esempio, la distribuzione gamma, per la quale ci sono tre parametrizzazioni che vedono un uso abbastanza comune - i due più comuni dei quali hanno sia la media che la varianza essendo funzioni di due parametri.
Tipicamente in un modello di regressione o in un GLM, o in un modello di sopravvivenza (tra molti altri tipi di modello), il modello può dipendere da più predittori, nel qual caso la distribuzione associata a ciascuna osservazione sotto il modello può avere uno dei suoi parametri (o anche diversi parametri) che sono correlati a molte variabili predittive ("variabili indipendenti").