Supponiamo che sia un insieme di risultati reciprocamente esclusivi di una variabile casuale discreta e sia una funzione di utilità in cui , , ecc.
Quando è uniformemente distribuito su e è una funzione di massa di probabilità , l'entropia di Shannon è massimizzato ( e quando un elemento in ha tutta la massa di , l'entropia di Shannon viene minimizzata ( , in effetti). Ciò corrisponde alle intuizioni su sorpresa (o riduzione dell'incertezza ) e risultati e incertezza (o sorpresa attesa ) e variabili casuali:H ( Ω ) = ∑ Ω f ( ω ) l o g 1
- Quando è distribuito uniformemente, l'incertezza è massimizzata e più risultati ci sono per la distribuzione uniforme della massa, più siamo incerti.
- Quando ha tutta la sua massa concentrata in un unico risultato, non abbiamo incertezza.
- Quando assegniamo un risultato una probabilità di , non otteniamo informazioni (non siamo "sorpresi") quando lo osserviamo effettivamente.
- Quando assegniamo a un risultato una probabilità sempre più vicina a , l'osservazione che si verifica effettivamente diventa sempre più informativa ("sorprendente").
(Tutto ciò non dice nulla dell'interpretazione molto più concreta, ma meno epistemica, della codifica delle informazioni / entropia di Shannon, ovviamente.)
Tuttavia, quando ha l'interpretazione di una funzione di utilità , esiste un'interpretazione sensata di o ? Mi sembra che potrebbero esserci:
- se come PMF rappresenta una distribuzione uniforme su , allora come funzione di utilità corrisponde all'indifferenza sugli esiti che non potrebbero essere maggiori *
- una funzione di utilità in cui un risultato ha tutta l'utilità e il resto non ne ha (per quanto distorta un'utilità come potrebbe esserci) corrisponde a preferenze relative molto forti - una mancanza di indifferenza.
C'è un riferimento in espansione su questo? Ho perso qualcosa riguardo ai limiti nel confrontare le funzioni di massa di probabilità e le utilità normalizzate relative rispetto a variabili casuali discrete?
* Sono consapevole delle curve di indifferenza e non vedo come potrebbero essere rilevanti per la mia domanda per una serie di ragioni, a partire dalla mia attenzione su uno spazio di campionamento categorico e dal fatto che non sono interessato a "indifferenza" di per sé, ma piuttosto come interpretare le utilità come probabilità e come interpretare i funzionali sulle probabilità quando la "distribuzione di probabilità" (discreta) in questione in realtà o (in aggiunta) ha l'interpretazione di una funzione di utilità.