In che modo il valore atteso si riferisce a media, mediana, ecc. In una distribuzione non normale?


9

In che modo il valore atteso di una variabile casuale continua si collega alla sua media aritmetica, alla mediana, ecc. In una distribuzione non normale (es. Inclinazione normale)? Sono interessato a qualsiasi distribuzione comune / interessante (es. Log-normale, semplice distribuzione bi / multimodale, qualsiasi altra cosa strana e meravigliosa).

Cerco principalmente risposte qualitative, ma sono gradite anche tutte le risposte quantitative o di formula. Mi piacerebbe in particolare vedere qualsiasi rappresentazione visiva che lo chiarisca.


Puoi essere un po 'più chiaro? La media aritmetica e la mediana sono funzioni che applichiamo ai dati, non nulla di intrinseco a particolari distribuzioni ... ad esempio, i dati non devono essere normali per poter calcolare la media del campione.
ospite

Ok, quindi la domanda dovrebbe essere tecnicamente "come si collega il valore atteso alla media, alla mediana ecc. Dei dati estratti casualmente da una particolare distribuzione di probabilità?" Sto cercando una comprensione semplice e intuitiva, simile al modo in cui puoi dire intuitivamente che quando una distribuzione è più distorta, la mediana e la media sono più distanti e la mediana può fornire una migliore indicazione di dove si trovano i dati.
naught101

Eh. Grazie Marco Ho chiaramente letto cose sbagliate. Potrei anche scriverlo come risposta, lo sceglierò come migliore risposta.
naught101

Risposte:


8

(parzialmente convertito dal mio commento ora cancellato sopra)

Il valore atteso e la media aritmetica sono esattamente la stessa cosa. La mediana è correlata alla media in modo non banale ma puoi dire alcune cose sulla loro relazione:

  • quando una distribuzione è simmetrica, la media e la mediana sono uguali

  • quando una distribuzione è inclinata negativamente, la mediana è generalmente maggiore della media

  • quando una distribuzione è inclinata positivamente, la mediana è generalmente inferiore alla media


Interessante. Quali esempi ci sono del comportamento insolito di una distribuzione negativamente distorta in cui la media è maggiore della mediana?
naught101

@ naught101: è un errore di battitura? Una distribuzione negativamente distorta è una distribuzione in cui gli esiti a sinistra del centro si verificano più frequentemente rispetto agli esiti a destra del centro, e quindi la "coda" di esiti a bassa frequenza va verso destra. In una tale situazione, la gobba a sinistra tirerà sempre la media (aritmetica) a sinistra del centro, mentre la coda a destra manterrà la mediana più grande della media.
Assad Ebrahim,

@AssadEbrahim: No, era un riferimento al commento di Macro "la mediana è generalmente maggiore della media" - chiedevo esempi contrari.
naught101

@ naught101: i contro-esempi nel caso di una distribuzione unimodale sono la sua linea successiva: quando la gobba è a destra, la coda a sinistra tira la mediana sotto la media. Più lunga è la coda, maggiore è il divario tra mediana e media.
Assad Ebrahim,

1
Quali sono le circostanze pratiche in cui si dovrebbe usare una mediana su una media o viceversa? Ad esempio nell'analisi della sopravvivenza in cui la vita segue una distribuzione esponenziale, dovrei usare la mediana (quindi metà delle cose dura più a lungo, metà ultima in meno) o la media (la vita "prevista") se dovessi prevedere la vita / morte come binario risultato?
drevicko,

5

Esiste una bella relazione tra la media armonica, geometrica e aritmetica di una variabile casuale distribuita logaritmicamente . PermettereX~LN(μ,σ2)

  • (media armonica),HM(X)=eμ-12σ2
  • (media geometrica),solM(X)=eμ
  • (media aritmetica).UNM(X)=eμ+12σ2

Non è difficile vedere che il prodotto della media armonica e aritmetica produce il quadrato della media geometrica, cioè

HM(X)UNM(X)=solM2(X).

XXX

solM(X)=HM(X)UNM(X).

Inoltre, la nota disuguaglianza HM-GM-AM

HM(X)solM(X)UNM(X)

può essere espresso come

HM(X)solVun'r(X)=solM(X)=UNM(X)solVun'r(X),

solVun'r(X)=eσ2


1

Per completezza, ci sono anche distribuzioni per le quali la media non è ben definita. Un esempio classico è la distribuzione di Cauchy ( questa risposta ha una bella spiegazione del perché). Un altro esempio importante è la distribuzione di Pareto con esponente inferiore a 2.


1
X=0

@Carl punti positivi: ho modificato la risposta di conseguenza. Many thx (:
drevicko,

0

Mentre è corretto che la media matematica e il valore di aspettativa siano definiti in modo identico, per una distribuzione distorta questa convenzione di denominazione diventa fuorviante.

Immagina di chiedere a un amico i prezzi delle case nella sua città perché ti piace davvero lì e in realtà pensi di trasferirti in quella città.

Se la distribuzione dei premi immobiliari è unimodale e simmetrica, allora il tuo amico può dirti il ​​prezzo medio delle case e puoi aspettarti di trovare la maggior parte delle case sul mercato intorno a quel valore medio .

Tuttavia, se la distribuzione dei prezzi delle case non è modale e distorta, ad esempio inclinata a destra con la maggior parte delle case nella fascia di prezzo inferiore a sinistra e solo alcune case esorbitanti a destra, la media sarà "inclinata" a prezzi elevati su la destra.

Per questa distribuzione dei prezzi delle case unimodale e distorta, puoi aspettarti di trovare la maggior parte delle case sul mercato intorno alla mediana .


1
Non è chiaro cosa intendi quando dici per distribuzioni unimodali distorte la distribuzione dei prezzi delle case ha prezzi intorno alla mediana. Ciò che si può dire è che metà dei valori sarà uguale o inferiore alla mediana e metà sarà uguale o superiore alla mediana. Non indica quanto questi valori siano vicini alla media.
Michael R. Chernick, il

Suppongo che la tua ultima frase dovrebbe finire con "mediana"? In tal caso, ritengo ovvio che la mediana debba essere il valore (raggiungibile) più vicino alla media (che potrebbe non essere raggiungibile, ad esempio, non un prezzo abitativo) di un campione casuale prelevato dalla popolazione sopra descritta. Questa è la mediana più vicina al campione medio, in media. In caso contrario, non ho fatto alcuna affermazione su quanto questi valori siano vicini alla media. Ho fatto una richiesta sulla loro distanza dalla mediana.
Sol Hator,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.