Per quale problema o gioco sono le soluzioni ottimali di varianza e deviazione standard?


9

Per una determinata variabile casuale (o una popolazione, o un processo stocastico), l'aspettativa matematica è la risposta a una domanda Quale previsione puntuale minimizza la perdita quadrata attesa? . Inoltre, è la soluzione ottimale per un gioco Indovina la prossima realizzazione di una variabile casuale (o un nuovo sorteggio da una popolazione) e ti punirò per la distanza al quadrato tra il valore e la tua ipotesi se hai disutilità lineare in termini della punizione. La mediana è la risposta a una domanda corrispondente in perdita assoluta e la modalità è la risposta in perdita "tutto o niente".

Domande: la varianza e la deviazione standard rispondono a domande simili? Quali sono?

La motivazione di questa domanda deriva dall'insegnamento di misure di base di tendenza e diffusione centrali. Mentre le misure di tendenza centrale possono essere motivate dai problemi teorici-decisionali di cui sopra, mi chiedo come si possano motivare le misure di diffusione.


1
Domanda molto interessante. Il mio approccio iniziale sarebbe che il "gioco" è qualitativamente lo stesso di quello che descrivi già, tranne per il fatto che la domanda si aspetta (non è previsto un gioco di parole) la risposta a un intervallo di valori anziché a un punto, poiché diffuso senza un punto di il riferimento è un'informazione piuttosto incompleta (se non insignificante).
Emil,

Nota che la varianza è essa stessa un'aspettativa - se allora . Var ( X ) = E ( Y )Y=(Xμ)2Var(X)=E(Y)
Glen_b -Restate Monica

@Glen_b, hai ragione, e l'ho capito (avrei dovuto includerlo nel testo della domanda). "Indovina la differenza tra il prossimo valore e l'aspettativa e ti punirò quadraticamente" sarebbe il gioco. È il migliore che ci sia? Non sembra un gioco molto pratico o molto divertente, IMHO.
Richard Hardy,

Risposte:


2

Se ho compreso la domanda come previsto, hai in mente un'impostazione in cui puoi ottenere realizzazioni indipendenti di qualsiasi variabile casuale con qualsiasi distribuzione (con varianza finita ). Il "gioco" è determinato dalle funzioni e da descrivere. Comprende i seguenti passaggi e regole:XFσ2(F)hL

  1. Il tuo avversario ("Natura") rivelaF.

  2. In risposta produci un numero tua "previsione".t(F),

Per valutare l'esito del gioco, vengono eseguiti i seguenti calcoli:

  • Un esempio di iid osservazioni è tratto danX=X1,X2,,XnF.

  • Una funzione predeterminata viene applicata al campione, producendo un numero la "statistica".hh(X),

  • La "funzione di perdita" confronta la tua "previsione" con la statistica producendo un numero non negativoLt(F)h(X),L(t(F),h(X)).

  • Il risultato del gioco è la perdita attesa (o "rischio")

    R(L,h)(t,F)=E(L(t(F),h(X))).

Il tuo obiettivo è rispondere alla mossa della Natura specificando alcune che minimizzano il rischio.t

Ad esempio, nel gioco con la funzione e qualsiasi perdita della forma per un numero positivo tua mossa ottimale è scegliere come aspettativa dih(X1)=X1L(t,h)=λ(th)2λ,t(F)F.

La domanda che abbiamo di fronte è:

Esistono L e h per le quali la mossa ottimale è scegliere t(F) come varianza σ2(F) ?

A questo si risponde prontamente esibendo la varianza come aspettativa. Un modo è di stabilire che

h(X1,X2)=12(X1X2)2
e continuare a utilizzare la perdita quadratica
L(t,h)=(th)2.
Osservandolo

E(h(X))=σ2(F),

l'esempio ci consente di concludere che questa h e questa L rispondono alla domanda sulla varianza.


Che dire della deviazione standard σ(F) ? Ancora una volta, dobbiamo solo mostrarlo come aspettativa di una statistica campione. Tuttavia, ciò non è possibile, perché anche quando limitiamo F alla famiglia delle distribuzioni di Bernoulli (p) possiamo ottenere solo stimatori imparziali delle funzioni polinomiali di p, ma σ(F)=p(1p) non è una funzione polinomiale sul dominiop(0,1). (VediPer la distribuzione binomiale, perché non esiste uno stimatore imparziale per?1/pPer l'argomento generale sulle distribuzioni binomiali, a cui questa domanda può essere ridotta dopo aver mediatohsu tutte le permutazioni diXi.)


Grazie per una chiara articolazione della mia domanda e una risposta altrettanto chiara. Avresti anche un esempio di che dipende da tutti i n punti di campionamento, non solo da due? hn
Richard Hardy,

2
Esiste un modo standard per passare da a n : calcola la statistica per tutte le coppie e media. In effetti, ciò produce la mia caratterizzazione della covarianza su stats.stackexchange.com/a/18200/919 . Per la teoria formale di questo, leggere le statistiche U . 2n
whuber

1
Grazie mille!
Richard Hardy,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.