Perché la distribuzione di Cauchy non ha alcun significato?


109

Dalla funzione di densità di distribuzione potremmo identificare una media (= 0) per la distribuzione di Cauchy proprio come mostra il grafico sotto. Ma perché diciamo che la distribuzione di Cauchy non ha significato?

inserisci qui la descrizione dell'immagine


2
Raccomando il riferimento Cabeza G., UA. (2013). La media della distribuzione di Cauchy. Nel blog Apoyo en Matemáticas sulla media della distribuzione di Cauchy.

Risposte:


99

Puoi controllare meccanicamente che il valore atteso non esista, ma questo dovrebbe essere fisicamente intuitivo, almeno se accetti il principio di Huygens e la Legge dei Grandi Numeri . La conclusione della Legge dei Grandi Numeri non riesce per una distribuzione di Cauchy, quindi non può avere un mezzo. Se si calcolano in media variabili casuali di Cauchy indipendenti, il risultato non converge in come con probabilità . Rimane una distribuzione di Cauchy della stessa dimensione. Questo è importante in ottica.0 n 1n0n1

La distribuzione di Cauchy è l'intensità della luce normalizzata su una linea da una sorgente puntuale. Il principio di Huygens dice che puoi determinare l'intensità supponendo che la luce venga riemessa da qualsiasi linea tra la sorgente e il bersaglio. Pertanto, l'intensità della luce su una linea a metri di distanza può essere determinata assumendo che la luce colpisca per prima una linea a metro di distanza e venga riemessa con qualsiasi angolo in avanti. L'intensità della luce su una linea a metri di distanza può essere espressa come la convoluzione volte della distribuzione della luce su una linea a metro di distanza. Cioè, la somma di distribuzioni indipendenti di Cauchy è una distribuzione di Cauchy ridimensionata di un fattore di .1 n n 1 n n21nn1nn

Se la distribuzione di Cauchy avesse una media, allora il ° percentile della convoluzione fold diviso per dovrebbe convergere a secondo la Legge dei Grandi Numeri. Invece rimane costante. Se si segna il ° percentile su una linea (trasparente) a metro di distanza, metri di distanza, ecc., Questi punti formano una linea retta, a gradi. Non si piegano verso .n n 0 25 1 2 45 025nn02512450

Questo ti dice in particolare della distribuzione di Cauchy, ma dovresti conoscere il test integrale perché ci sono altre distribuzioni senza mezzi che non hanno una chiara interpretazione fisica.


39
+1 Ora c'è una risposta illuminante :-) (scusa). A proposito, il principio prende il nome da Christiaan Huygens, non da Huygen. Huygens fu il primo ad apprezzare i nuovi sviluppi nella probabilità pubblicati nel 1650 da Pascal (sulla base delle sue lettere con Fermat): fu il resoconto di Huygens su queste idee (1657), incluso quello dell'attesa, che originariamente ottenne la teoria della probabilità su un matematico piede e spianò la strada al trattato (postumo) seminale di Jakob Bernoulli ( Ars Conjectandi , 1713).
whuber

4
Le ampiezze si propagano, non le intensità.
Doru Constantin,

2
Questa è un'ottima risposta, ma trovo la fine confusa: "... segna il 25 ° percentile su ... una linea retta, a 45 gradi. Non si piegano verso 0." La stessa affermazione è vera (come conseguenza del principio di Huygens-Fresnel), ma è prima "divisa per ". Quando dividi per 2 a 2 metri, diviso per 3 a 3 metri, ..., la linea trasparente è verticale (perpendicolare allo schermo che cattura la luce). La linea quantile di 45 gradi appartiene alla somma di Cauchy e non aiuta (ancora) con l'argomento. n
Lee David Chung Lin,

40

Risposta aggiunta in risposta al commento di @ whuber sulla risposta di Michael Chernicks (e riscritta completamente per rimuovere l'errore segnalato da whuber.)

Si dice che il valore dell'integrale per il valore atteso di una variabile casuale di Cauchy sia indefinito perché il valore può essere "fatto" per essere qualsiasi cosa ci piaccia. L'integrale (interpretato nel senso di un integrale di Riemann) è ciò che viene comunemente chiamato un integrale improprio e il suo valore deve essere calcolato come valore limite: o

xπ(1+x2)dx
- x
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
e, naturalmente, entrambe le valutazioni dovrebbero dare lo stesso valore finito. In caso contrario, si dice che l'integrale non è definito. Ciò mostra immediatamente perché la media della variabile aleatoria di Cauchy non è definita: il valore limite nel limite interno diverge.

Il valore principale di Cauchy è ottenuto come un unico limite: invece del doppio limite sopra. Il valore principale dell'integrale aspettativa è facilmente visibile per essere poiché il limitand ha valore per tutti . Ma questo non può essere usato per dire che la media di una variabile casuale di Cauchy è . Cioè, la media è definita come il valore dell'integrale nel senso comune e non nel senso del valore principale.

limTTTxπ(1+x2)dx
00T0

Per , considera invece l'integrale che si avvicina ad un valore limite di come . Quando , otteniamo il valore principale discusso sopra. Pertanto, non possiamo assegnare un significato inequivocabile all'espressioneα>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
ln(α)πTα=10
xπ(1+x2)dx
senza specificare come sono stati avvicinati i due infiniti e ignorare questo punto porta a tutto una sorta di complicazioni e risultati errati perché le cose non sono sempre quelle che sembrano quando il latte del valore principale si maschera come la crema del valore. Questo è il motivo per cui la media della variabile aleatoria di Cauchy viene definita non definita anziché avere valore , il valore principale dell'integrale.0

Se si utilizza l'approccio teorico-misura alla probabilità e l'integrale del valore atteso è definito nel senso di un integrale di Lebesgue, allora il problema è più semplice. esiste solo quando è finito, quindi non è definito per una variabile casuale Cauchy poiché non è finito.g|g|E[X]XE[|X|]


9
La valutazione dell'integrale centrale non è corretta: è zero, non un logaritmo. Il problema in realtà sta nel valutare i due limiti impliciti negli integrali infiniti.
whuber

@whuber Grazie per aver segnalato l'errore. Ho completamente riscritto la mia risposta e il tuo commento non è più valido.
Dilip Sarwate,

Non capisco perché non esista l'aspettativa del rapporto. Se e sono normalmente distribuiti congiuntamente con una media diversa da zero, la media di è data da , cosa mi sto perdendo? XYZ=XYxyp(x,y)dxdy
Royi,

@Drazick Non ho menzionato il rapporto tra due normali variabili casuali in nessun punto della mia risposta. Si prega di chiedere a qualcuno che ha sollevato questo problema rispetto alle variabili casuali di Cauchy.
Dilip Sarwate,

2
@Drazick Verifica se il tuo integrale esiste affatto. In generale, se la densità di è continua in un vicinato di , E [X ^ {- 1}] $ non esiste. X0
Dilip Sarwate,

33

Mentre le risposte di cui sopra sono valide spiegazioni del perché la distribuzione di Cauchy non ha aspettative, trovo che il rapporto di due variate normali indipendenti sia Cauchy altrettanto illuminante: infatti, noi hanno e la seconda aspettativa è .X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
Èuna variabile casuale di Cauchy 'piegata' quando so che è Cauchy standard? Come si può trovare la distribuzione di? |X1X2|X1X2|X1X2|
Testardo

1
Sì, questo è il valore assoluto di una variabile di Cauchy, che ha quindi la densità sui numeri reali positivi. f(x)+f(x)
Xi'an,

Se pieghi la distribuzione normale, alloranon è l'infinito? E1/|X2|
Albert Chen il

È l'infinito.
Xi'an,

22

Il Cauchy non ha alcuna media perché il punto selezionato (0) non è una media. È una mediana e una modalità . La media per una distribuzione assolutamente continua è definita come dove è la funzione di densità e l'integrale viene assunto sul dominio di (che è a nel caso del Cauchy). Per la densità di Cauchy, questo integrale non è semplicemente finito (la metà da a è e la metà da a è ).f f - - 0 - 0 xf(x)dxff00


9
Non ti sto criticando, @Dilip: sto aumentando la tua osservazione. Ciò che è molto interessante è che l'esistenza di un valore principale zero potrebbe indurci a definire la media della distribuzione di Cauchy (o la media di qualsiasi camper) come valore principale dell'integrale. Questo indaga molto più in profondità nella natura di questa domanda, che viene chiarita dichiarando che l'integrale è infinito o indefinito: vale a dire, perché il valore principale non funziona ? Perché non sarebbe legittimo usarlo come mezzo?
whuber

5
@whuber È anche interessante che se si tronca l'integrale in -a e + a per qualsiasi a> 0 si ottiene 0. Quindi, prendendo il limite come approccio ∞ dell'integrale simmetrico si ottiene 0. Un altro motivo per chiedere perché non lo è 0 la media.
Michael Chernick,

10
@whuber: prendo la tua ultima domanda nella tua penultima osservazione per essere retorica; in ogni caso vogliamo una convergenza assoluta e "la" ragione nella mia mente è che vogliamo che le cose si comportino come aree. In particolare, dobbiamo essere in grado di tagliare le cose (funzioni) in pezzi e riordinarle a piacimento senza disturbare la risposta che otteniamo. Non possiamo fare questo taglio e riordinamento per una funzione lineare contro una distribuzione di Cauchy, quindi dobbiamo insistere sul fatto che la sua media non esiste.
cardinale il

9
Quella, @cardinal, è una buona risposta! Non ero semplicemente retorico, perché la domanda stessa pone "perché diciamo [la] distribuzione di Cauchy non ha senso?" Affermare che l'aspettativa è indefinita può soddisfare l'incurante, ma la possibilità che esista una definizione alternativa ragionevole dell'integrale - e produce una risposta intuitivamente corretta! - dovrebbe turbare le persone. La tua risposta è vicina a ciò che avevo in mente, ma è ancora incompleta. Penso che una risposta soddisfacente identificherebbe importanti teoremi della teoria statistica che falliscono quando lavoriamo con integrali condizionatamente convergenti.
whuber

7
@Dilip L'ho pensato anch'io, ma riflettendomi trovo che questo sia un po 'più stimolante di quanto sembri suggerire. Ad esempio, non c'è alcun problema con il Teorema del limite centrale: richiedere una varianza garantisce automaticamente un'aspettativa, ovviamente. E molti teoremi sono dimostrati usando la disuguaglianza di Chebyshev, dove ancora una volta ci viene garantito un mezzo. Quindi sono davvero curioso: quali sono i grandi teoremi utilizzati nella pratica della statistica in cui dobbiamo davvero essere consapevoli dei problemi con aspettative condizionatamente convergenti, ma non convergenti?
whuber

16

La distribuzione di Cauchy è meglio pensata come la distribuzione uniforme su un cerchio unitario, quindi sarebbe sorprendente se la media avesse un senso. Supponiamo che fosse una sorta di "funzione media". Cioè, supponiamo che, per ogni sottoinsieme finito del cerchio unitario, fosse un punto del cerchio unitario. Chiaramente, deve essere "innaturale". Più precisamente non può essere equivariante rispetto alle rotazioni. Per ottenere la distribuzione di Cauchy nella sua forma più consueta, ma meno rivelatrice, proiettare il cerchio unitario sull'asse x da (0,1) e utilizzare questa proiezione per trasferire la distribuzione uniforme sul cerchio sull'asse x.X f ( X ) f ffXf(X)ff

Per capire perché la media non esiste, pensa a x come una funzione nel cerchio unitario. È abbastanza facile trovare un numero infinito di archi disgiunti sul cerchio unitario, in modo tale che, se uno degli archi ha lunghezza d, allora x> 1 / 4d su quell'arco. Quindi ciascuno di questi archi disgiunti contribuisce per oltre 1/4 alla media e il contributo totale di questi archi è infinito. Possiamo fare di nuovo la stessa cosa, ma con x <-1 / 4d, con un contributo totale meno l'infinito. Questi intervalli potrebbero essere visualizzati con un diagramma, ma è possibile creare diagrammi per Convalida incrociata?


1
Benvenuto nel sito, @DavidEpstein. Puoi creare immagini con il tuo software preferito e caricarle nella tua risposta facendo clic sull'icona della piccola immagine (per avviare la procedura guidata) sopra il campo di risposta. Sfortunatamente, per farlo è necessario> = 10 rappresentanti. Sono sicuro che lo avrai abbastanza presto; nel frattempo, se puoi pubblicare l'immagine ovunque su Internet e pubblicare un link ad essa nella tua risposta, un utente con un alto rappresentante può recuperarla e pubblicarla per te.
gung

3
Non ero a conoscenza del fatto che Cauchy fosse interpretato come un'uniforme in un cerchio, ma ha sicuramente senso. Un argomento topologico mostra che non può esserci alcuna funzione continua su un cerchio che ha le proprietà di una funzione di media.
johnny,

@DavidEpstein Ho anche letto la tua risposta nell'altro post . La proiezione stereografica è davvero bella. In confronto, puoi commentare perché la proiezione radiale altrettanto valida di un semicerchio non implica che il mezzo sia ben definito? Vale a dire, , quindi è lo standard Cauchy. Dal punto di vista geometrico, questo è il fatto fondamentale che un angolo inscritto è sempre la metà del suo angolo centrale corrispondente. X tan ( π ( U - 1UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin,

In realtà in termini di modello fisico di una fonte di luce, l'immagine del semicerchio è più appropriata, poiché non è immediatamente chiaro perché il principio di Huygens ti darebbe una proiezione stereografica.
Lee David Chung Lin,

10

Il valore medio o atteso di una variabile casuale è un integrale di Lebesgue definito su una misura di probabilità : P E X = X d PXP

EX=XdP

La non esistenza della media della variabile casuale di Cauchy significa semplicemente che l'integrale di Cauchy rv non esiste. Questo perché le code della distribuzione di Cauchy sono code pesanti (rispetto alle code della distribuzione normale). Tuttavia, la non esistenza del valore atteso non proibisce l'esistenza di altre funzioni di una variabile casuale di Cauchy.


5
Le code sono "pesanti", nel senso che non si decompongono abbastanza velocemente in entrambe le direzioni per far convergere l'integrale. Questo concetto non ha nulla a che fare con le distribuzioni normali (o qualsiasi distribuzione di riferimento).
whuber

4
Sì, grazie per questa correzione. Non ho intenzione di implicare alcun legame rigoroso tra code pesanti e distribuzione normale. Tuttavia, penso che confrontare la distribuzione normale (con code leggere) e la distribuzione dalla coda pesante rende visivamente (non sempre) un po 'più facile comprendere il concetto di code "pesanti".
Tomas,

5

Ecco più di una spiegazione visiva. (Per quelli di noi che sono sfidati in matematica.). Prendi un generatore di numeri casuali distribuito in modo cauchy e prova a calcolare la media dei valori risultanti. Ecco una buona pagina su una funzione per questo. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Scoprirai che la "punta" dei valori casuali fa sì che diventi più grande man mano che vai invece che più piccolo . Quindi non ha alcun mezzo.


4

Solo per aggiungere alle eccellenti risposte, farò alcuni commenti sul perché la non convergenza dell'integrale è rilevante per la pratica statistica. Come altri hanno già detto, se permettessimo che il valore principale fosse una "media", gli slln non sono più validi! A parte questo, pensa alle implicazioni del fatto che, in pratica, tutti i modelli sono approssimazioni. In particolare, la distribuzione di Cauchy è un modello per una variabile casuale illimitata. In pratica, le variabili casuali sono limitate, ma i limiti sono spesso vaghi e incerti. L'uso di modelli illimitati è un modo per alleviarlo, rende superflua l'introduzione di limiti non sicuri (e spesso innaturali) nei modelli. Ma perché ciò abbia un senso, aspetti importanti del problema non dovrebbero essere influenzati. Ciò significa che, se dovessimo introdurre limiti, ciò non dovrebbe alterare in modo importante il modello. Ma quando l'integrale è non convergente, ciò non accade! Il modello è instabile, nel senso che l'aspettativa del camper dipenderebbe da limiti ampiamente arbitrari. (Nelle applicazioni, non c'è necessariamente alcun motivo per rendere i limiti simmetrici!)

Per questo motivo, è meglio dire che l'integrale è divergente che dire che è "infinito", l'ultimo essendo vicino a implicare un valore definito quando non esiste! Una discussione più approfondita è qui .


-4

Volevo essere un po 'esigente per un secondo. L'immagine in alto è sbagliata. L'asse x è in deviazioni standard, qualcosa che non esiste per la distribuzione di Cauchy. Sono pignolo perché uso la distribuzione di Cauchy ogni singolo giorno della mia vita nel mio lavoro. C'è un caso pratico in cui la confusione potrebbe causare un errore empirico. La distribuzione t di Student con 1 grado di libertà è lo standard Cauchy. Di solito elencherà i vari sigmi richiesti per il significato. Questi sigmi NON sono deviazioni standard, sono probabili errori e mu è la modalità.

Se si desidera eseguire correttamente il grafico sopra riportato, l'asse x è costituito da dati non elaborati o se si desidera che abbiano errori di dimensioni equivalenti, si otterrebbero gli stessi probabili errori. Un probabile errore è .67 deviazioni standard in termini di dimensioni sulla distribuzione normale. In entrambi i casi è la gamma semi-interquartile.

Ora, per quanto riguarda una risposta alla tua domanda, tutto ciò che tutti hanno scritto sopra è corretto ed è la ragione matematica per questo. Tuttavia, sospetto che tu sia uno studente e nuovo sull'argomento e quindi le soluzioni matematiche controintuitive all'ovvio visuale potrebbero non sembrare vere.

Ho due campioni del mondo reale quasi identici, tratti da una distribuzione di Cauchy, entrambi hanno la stessa modalità e lo stesso probabile errore. Uno ha una media di 1,27 e uno ha una media di 1,33. Quello con una media di 1,27 ha una deviazione standard di 400, quello con una media di 1,33 ha una deviazione standard di 5,15. L'errore probabile per entrambi è .32 e la modalità è 1. Ciò significa che per i dati simmetrici, la media non è nel 50% centrale. Basta una sola osservazione aggiuntiva per spingere la media e / o la varianza fuori dal significato per qualsiasi test. Il motivo è che la media e la varianza non sono parametri e la media del campione e la varianza del campione sono essi stessi numeri casuali.

La risposta più semplice è che i parametri della distribuzione di Cauchy non includono una media e quindi nessuna varianza rispetto a una media.

È probabile che nella pedagogia del passato l'importanza della media fosse in quanto di solito è una statistica sufficiente. Nelle statistiche a lungo termine basate sulla frequenza la distribuzione di Cauchy non ha statistiche sufficienti. È vero che la mediana del campione, per una distribuzione di Cauchy con supporto su tutti i reali, è una statistica sufficiente, ma è perché eredita da una statistica dell'ordine. È una specie di coincidenza sufficiente, privo di un modo semplice di pensarci. Ora nelle statistiche bayesiane esiste una statistica sufficiente per i parametri della distribuzione di Cauchy e se si utilizza un'uniforme precedente, anche questa è imparziale. Lo sostengo perché se devi usarli quotidianamente, hai imparato tutti i modi per eseguire delle stime su di essi.

Non esistono statistiche valide per gli ordini che possono essere utilizzate come stimatori per le distribuzioni troncate di Cauchy, che sono quelle che è probabile che si verifichino nel mondo reale, quindi non esiste una statistica sufficiente nei metodi basati sulla frequenza per la maggior parte, ma non per tutte le applicazioni del mondo reale .

Quello che suggerisco è di allontanarmi dal medio, mentalmente, come qualcosa di reale. È uno strumento, come un martello, che è ampiamente utile e di solito può essere utilizzato. A volte questo strumento non funzionerà.

Una nota matematica sulle distribuzioni normali e di Cauchy. Quando i dati vengono ricevuti come serie temporali, la distribuzione normale si verifica solo quando gli errori convergono in zero quando t va all'infinito. Quando i dati vengono ricevuti come serie temporali, la distribuzione di Cauchy avviene quando gli errori divergono all'infinito. Uno è dovuto a una serie convergente, l'altro a una serie divergente. Le distribuzioni di Cauchy non arrivano mai a un punto specifico al limite, oscillano avanti e indietro su un punto fisso in modo che il cinquanta percento delle volte si trovino da una parte e il cinquanta percento delle volte dall'altra. Non c'è inversione mediana.


9
C'è un po 'di confusione in questa risposta! Ad esempio, dice "Ora nelle statistiche bayesiane esiste una statistica sufficiente per i parametri della distribuzione di Cauchy e se si utilizza un'uniforme precedente, allora è anche imparziale". È difficile dare un senso a questo! In primo luogo, i concetti di sufficienza di Frequentist e Bayesian sono molto vicini (e credo che possano differire solo in alcuni spazi campione, infiniti e infiniti, quindi la linea reale è la stessa). Non esiste una statistica sufficiente per il modello di Cauchy, di dimensione fissa !, semplicemente (i dati completi ovviamente sono sufficienti).
kjetil b halvorsen,

-6

Per dirla semplicemente, l'area sotto la curva si avvicina all'infinito mentre si esegue lo zoom indietro. Se campionate una regione finita, potete trovare una media per quella regione. Tuttavia, non esiste alcun mezzo per l'infinito.


8
L'area sotto il PDF è uguale a , per definizione, quindi devi indicare qualcos'altro con "la curva". Che cos'è? 1
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.