Sono curioso della natura di . Qualcuno può dire qualcosa di intuitivo su "Cosa dice sui dati?"
Modificare:
Grazie per le risposte
Dopo aver seguito alcuni ottimi corsi, vorrei aggiungere alcuni punti:
- È una misura di informazione, cioè è la quantità di informazioni lungo la direzione .
- Dualità: poiché è definito positivo, così è , quindi sono norme punto-prodotto, più precisamente sono doppie norme l'una dall'altra, quindi possiamo derivare Fenchel doppia per il problema dei minimi quadrati regolarizzati, e massimizzare il doppio problema. Possiamo scegliere uno di essi, a seconda del loro condizionamento.
- Spazio di Hilbert: le colonne (e le righe) di e coprono lo stesso spazio. Quindi non vi è alcun vantaggio (altro che quando una di queste matrici è mal condizionata) tra rappresentazione con o
- Statistiche bayesiane: la norma di gioca un ruolo importante nelle statistiche bayesiane. Cioè ha determinato quante informazioni abbiamo in precedenza, ad esempio, quando la covarianza della densità precedente è come abbiamo non informativo (o probabilmente Jeffreys precedente)
- Statistiche del frequentista: è strettamente correlato alle informazioni di Fisher, usando il limite di Cramér – Rao. In effetti, la matrice di informazioni del pescatore (prodotto esterno del gradiente della verosimiglianza con se stessa) è legata da Cramér-Rao, cioè (cono semi-definito positivo wrt, concentrazione di iewrt ellissoidi). Pertanto, quando lo stimatore della massima verosimiglianza è efficiente, ovvero esiste la massima informazione nei dati, quindi il regime frequentista è ottimale. In parole più semplici, per alcune funzioni di verosimiglianza (si noti che la forma funzionale della verosimiglianza dipende esclusivamente dal modello probabilistico che presumibilmente ha generato dati, alias modello generativo), la verosimiglianza massima è stimatore efficiente e coerente, regole come un boss. (scusa per l'eccesso di esso)