Valore atteso vs. valore più probabile (modalità)


15

Il valore atteso di una distribuzione f(x) è la media, ovvero il valore medio ponderato

E[x]=+xf(x)dx

Il valore più probabile è la modalità, ovvero il valore più probabile.

Tuttavia, ci aspettiamo in qualche modo di vedere molte volte? Citando da qui :E[x]

Se i risultati non sono ugualmente probabili, la media semplice deve essere sostituita con la media ponderata, che tiene conto del fatto che alcuni risultati sono più probabili di altri. L'intuizione rimane comunque la stessa: il valore atteso di è ciò che ci si aspetta che accada in media .xix

Non riesco a capire cosa significhi "accadere in media", ciò significa che, per esempio, prendendo una misura molto tempo mi aspetto di vedere più di altri valori di ? Ma questa non è la definizione di modalità?E[x]x

Quindi, come interpretare l'affermazione? E qual è il significato probabilistico di ?E[x]


Vorrei anche mostrare un esempio in cui mi confondo. Studiando la distribuzione di ho imparato che la modalità è , mentre , dove \ nu sono i gradi di libertà dei dati.χ2χmode2=ν2E[χ2]=νν

Ho sentito all'università che, quando faccio un test χ2 dopo aver usato il metodo dei minimi quadrati per adattarsi a un insieme di dati, dovrei aspettarmi di ottenere χ2ν perché "questo è ciò che accade in generale".


Ho frainteso tutto questo o il valore atteso è in qualche modo molto probabile? (Anche se il valore più probabile è ovviamente la modalità)


4
Mi piace molto il potere della metafora dei ticket-in-a-box per questa domanda, perché produce una risposta semplice, chiara: l'aspettativa di una variabile casuale è la somma dei suoi valori (come disegnato sui ticket) diviso per il conteggio dei biglietti. Questo è tutto. Qualsiasi affermazione che non segue da questa definizione (o equivalenti matematici più sofisticati di essa) è solo un'euristica e potrebbe in alcuni casi essere errata.
whuber

Risposte:


18

Per una distribuzione normale, il valore atteso, ovvero la media, è uguale alla modalità.

In generale, non solo il valore atteso non solo non è il più probabile (o alla massima densità), ma potrebbe non avere alcuna possibilità di verificarsi. Ad esempio, considera la variabile casuale X che è uguale a 0 o 2, ciascuno con probabilità 0,5. Quindi EX = 1, ma il valore atteso, 1, ha 0 probabilità di verificarsi, mentre 0 e 2 sono entrambe le modalità di distribuzione.

La citazione "il valore atteso di x è ciò che ci si aspetta che accada in media" è il linguaggio non tecnico dei non addetti ai lavori, che, come risulta dalla tua confusione, serve solo a confondere le cose. Il valore atteso ha un significato molto specifico nella probabilità come media matematica. Mentre nella lingua dei non addetti ai lavori, un valore atteso o "in media" può essere qualcosa che dovrebbe verificarsi in genere. Questi possono essere riconciliati se "in media" è interpretato come la media matematica di ciò che accade.

In attesa tuo,

Joe medio


1
Sorge la domanda: che dire della mediana, che è garantita essere possibile ?
stella luminosa il

Come ha detto @TrevorAlexander, neanche la modalità offre garanzie. Considera la modalità di distribuzione continua.
Tim

3
@Trevor Alexander C'è sempre una mediana che è possibile (probabilità o densità positiva). Tuttavia, non tutte le mediane sono necessariamente possibili. Una mediana della variabile casuale X è un qualsiasi punto m per cui e P ( X m ) 1 / 2 . Se X è uguale a 1,2,3, o 4, ciascuno con probabilità 1/4, allora qualsiasi numero nell'intervallo [2,3] è una mediana di X.P(Xm)1/2P(Xm)1/2
Mark L. Stone

5

P(X=E(X))=0
X

L'unica giustificazione per il valore atteso, e il motivo per cui "ci aspettiamo di vederlo spesso", è la Legge dei grandi numeri :

nXi

X1++XnnE(X)

p>1211p0

E(X)=1p+0(1p)=p

Ora chiaramente "p" non accadrà mai (è testa o coda, o 0 o 1).

E(X)=p


Non direi che la legge dei grandi numeri sia l' unica giustificazione per il valore atteso. Ad esempio, en.wikipedia.org/wiki/… è una giustificazione per considerare i valori attesi delle funzioni di utilità (non ho studiato la prova ma sono sorpreso se in qualche modo si basa sulla legge di grandi numeri).
Juho Kokkala,

3

Non mi piace il termine "valore atteso" e non l'ho usato quando ho insegnato probabilità. "Media aritmetica" è migliore, secondo me, perché la media aritmetica di un dado a 6 facce è 3,5 ma un tale numero non si verifica. Inizialmente ho sentito il termine "valore di aspettativa" per il concetto quando ero al college. Molti termini tecnici non concordano con l'ovvio significato non tecnico. ("O" mi viene in mente.)

Si noti che una distribuzione può avere più di una modalità ma la media aritmetica è unica. Modalità, media e mediana sono diverse e hanno usi diversi.


1
Bello sul "o". Ciò mi ha fatto pensare al mio corso di Programmazione lineare in cui abbiamo studiato diversi teoremi dell'alternativa. Erano della forma "O è vero o B è vero, ma non entrambi". È molto più facile esprimerlo come A xor B. Non sento molto uso di xor nelle conversazioni casuali in strada.
Mark L. Stone,

2

La differenza è più facile da vedere con distribuzioni discrete:

Considera due insiemi di valori in cui è altrettanto probabile che ciascun numero venga disegnato: {1,2,2,2,10} e {1,2,2,2,3}.

Entrambi hanno la stessa modalità (2), ma i valori previsti differiscono. Il valore atteso attribuisce maggior peso a valori elevati mentre la modalità cerca semplicemente quale valore si presenta frequentemente. Quindi, se si attingesse da questa distribuzione un sacco di volte, la media del campione sarebbe vicina al valore previsto, mentre il numero intero più comune che si verificherebbe sarebbe il più vicino alla modalità.

mode=argmaxf(x)xf(x)

L'uso della lingua per distinguere tra diverse misure di tendenza centrale è un problema comune nell'apprendimento delle statistiche. Ad esempio, la mediana è un'altra misura che non è distorta da valori di grandi dimensioni come la media.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.