Molti PDF vanno da meno a infinito positivo, ma alcuni mezzi sono definiti e altri no. Quale tratto comune rende alcuni calcolabili?
Molti PDF vanno da meno a infinito positivo, ma alcuni mezzi sono definiti e altri no. Quale tratto comune rende alcuni calcolabili?
Risposte:
La media di una distribuzione è definita in termini di un integrale (lo scriverò come per una distribuzione continua - come un integrale di Riemann, diciamo - ma il problema si applica più in generale; possiamo procedere all'integrazione di Stieltjes o Lebesgue per occuparci di questi correttamente e tutti in una volta):
Ma cosa significa? È effettivamente una scorciatoia per
o
(anche se potresti romperlo ovunque non solo a 0)
Il problema sorge quando i limiti di quegli integrali non sono finiti.
Quindi, ad esempio, considera la densità standard di Cauchy, che è proporzionale a ... nota che
lascia , quindi d u = 2 x
che non è finito. Anche il limite nella metà inferiore non è finito; l'attesa non è quindi definita.
O se avessimo come variabile casuale il valore assoluto di un Cauchy standard, la sua intera aspettativa sarebbe proporzionale a quel limite che abbiamo appena esaminato (cioè ).
D'altra parte, alcune altre densità continuano "all'infinito" ma il loro integrale ha un limite.
Le altre risposte sono buone, ma potrebbero non convincere tutti, specialmente le persone che danno un'occhiata alla distribuzione di Cauchy (con ) e dicono che è ancora intuitivamente ovvio che la media dovrebbe essere zero.
Il motivo per cui la risposta intuitiva non è corretta dal punto di vista matematico è dovuto al teorema di riarrangiamento di Riemann (video) .
In effetti quello che stai facendo quando guardi un Cauchy e dici che la media "dovrebbe essere zero" è che stai dividendo il "centro" a zero, e quindi rivendicando i momenti del bilanciamento delle due dimensioni. O in altre parole, stai implicitamente facendo una somma infinita con "metà" i termini positivi (i momenti in ogni punto a destra) e "metà" i termini negativi (i momenti in ogni punto a sinistra) e rivendicandoli somma a zero. (Per gli esperti tecnici: )
Il teorema di riarrangiamento di Riemann afferma che questo tipo di somma infinita (una con entrambi i termini positivo e negativo) è coerente solo se le due serie (solo termini positivi e solo termini negativi) sono convergenti se prese indipendentemente. Se entrambe le parti (positive e negative) sono divergenti da sole, allora puoi trovare un ordine di somma dei termini in modo tale che si sommi a qualsiasi numero. (Video sopra, a partire dalle 6:50)
Quindi, sì, se esegui la somma in modo equilibrato da 0 in poi, i primi momenti della distribuzione di Cauchy si annullano. Tuttavia, la definizione (standard) di media non impone questo ordine di somma. Dovresti essere in grado di sommare i momenti in qualsiasi ordine e renderlo ugualmente valido. Pertanto, la media della distribuzione di Cauchy non è definita: scegliendo giudiziosamente come sommare i momenti, è possibile farli "bilanciare" (o meno) praticamente in qualsiasi punto.
Quindi, per definire la media di una distribuzione, i due momenti integrali devono essere ciascuno convergente (finito) in modo indipendente attorno alla media proposta (che, quando si fa la matematica, è davvero solo un altro modo di dire che l'integrale completo ( ) deve essere convergente). Se le code sono abbastanza "grasse" per rendere infinito il momento per un lato, il gioco è fatto. Non puoi bilanciarlo con un momento infinito dall'altra parte.
Devo dire che il comportamento "controintuitivo" di cose come la distribuzione di Cauchy è interamente dovuto a problemi quando si pensa all'infinito. Prendi la distribuzione di Cauchy e taglia le code - anche arbitrariamente lontano, come a più / meno il numero xkcd - e (una volta ri-normalizzato) improvvisamente ottieni qualcosa che si comporta bene e ha una media definita. Non sono le code grasse di per sé che sono un problema, è come si comportano quelle code quando ti avvicini all'infinito.
Il generale Abrial e Glen_b avevano risposte perfette. Voglio solo aggiungere una piccola demo per mostrare che la media della distribuzione di Cauchy non esiste / non converge.
Nel seguente esperimento, vedrai, anche se ottieni un campione di grandi dimensioni e calcoli la media empirica dal campione, i numeri sono abbastanza diversi da esperimento a esperimento.
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
Puoi osservare che abbiamo esperimenti e in ogni esperimento, campioniamo punti da due distribuzioni, con una dimensione del campione così grande, la media empirica attraverso esperimenti diversi dovrebbe essere abbastanza vicina alla media vera. I risultati mostrano che la distribuzione di Cauchy non ha una media convergente, ma la distribuzione normale ha.1 × 10 5
MODIFICARE:
Come @ mark999 menzionato nella chat, dovremmo sostenere che le due distribuzioni utilizzate nell'esperimento hanno una "varianza" simile (il motivo per cui uso la citazione è perché anche la varianza della distribuzione di Cauchy non è definita). Ecco la giustificazione: i loro PDF sono simili.
Si noti che, guardando il PDF della distribuzione di Cauchy, indoviniamo che è , ma dagli esperimenti che possiamo vedere, non esiste. Questo è il punto della demo.
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Per definizione di integrale di Lebesgue-Stieltjes, la media esiste se:
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
La distribuzione di Cauchy è una forma mascherata di una distribuzione molto fondamentale, vale a dire la distribuzione uniforme su un cerchio. Nelle formule, la probabilità infinitesimale è , dove è la coordinata dell'angolo. La probabilità (o misura) di un arco è . Questo è diverso dalla distribuzione uniforme , sebbene le misure siano effettivamente le stesse per gli archi che non contengono . Ad esempio, sull'arco da in senso antiorario a , la media della distribuzione sul cerchio è. Ma la media della distribuzione uniforme sull'unione corrispondente di due intervalli disgiunti, ciascuno di lunghezza , è zero.
Poiché la distribuzione sul cerchio è simmetrica in senso rotazionale, non può esserci una media, una mediana o una modalità sul cerchio. Allo stesso modo, i momenti più alti, come la varianza, non possono avere senso. Questa distribuzione nasce naturalmente in molti contesti. Ad esempio, il mio progetto attuale prevede immagini al microscopio di tessuto canceroso. I moltissimi oggetti nell'immagine non sono simmetrici e una "direzione" può essere assegnata a ciascuno. L'ovvia ipotesi nulla è che queste direzioni siano distribuite uniformemente.
Per mascherare la semplicità, sia il cerchio unitario standard e sia . Definiamo come funzione di mediante proiezione stereografica del cerchio da sull'asse . La formula è . Differenziando, troviamo . La probabilità infinitesimale è quindi , la solita forma della distribuzione di Cauchy, e "Hey, presto!", La semplicità diventa un mal di testa, che richiede un trattamento da parte delle sottigliezze della teoria dell'integrazione.
In , possiamo ignorare l'assenza di (in altre parole, ripristinare ) per qualsiasi considerazione come la media o il momento dell'ordine superiore, perché la probabilità di (la sua misura) è zero. Quindi, quindi, la non esistenza di momenti medi e superiori si estende alla linea reale. Tuttavia, ora esiste un punto speciale, vale a dire , che mappa a sotto proiezione stereografica e questo diventa la mediana e la modalità della distribuzione di Cauchy.pp∈ S 1 p-p=(0,-1)0∈ R