Perché è così comune ottenere stime della massima verosimiglianza dei parametri, ma non si sente praticamente mai delle stime dei parametri di verosimiglianza attese (cioè, basate sul valore atteso piuttosto che sulla modalità di una funzione di verosimiglianza)? Questo è principalmente per ragioni storiche o per ragioni tecniche o teoriche più sostanziali?
Ci sarebbero vantaggi e / o svantaggi significativi nell'utilizzare le stime di probabilità previste piuttosto che le stime di massima verosimiglianza?
Ci sono alcune aree in cui le stime di probabilità attese vengono abitualmente utilizzate?