Dalla funzione di densità di distribuzione potremmo identificare una media (= 0) per la distribuzione di Cauchy proprio come mostra il grafico sotto. Ma perché diciamo che la distribuzione di Cauchy non ha significato?
Dalla funzione di densità di distribuzione potremmo identificare una media (= 0) per la distribuzione di Cauchy proprio come mostra il grafico sotto. Ma perché diciamo che la distribuzione di Cauchy non ha significato?
Risposte:
Puoi controllare meccanicamente che il valore atteso non esista, ma questo dovrebbe essere fisicamente intuitivo, almeno se accetti il principio di Huygens e la Legge dei Grandi Numeri . La conclusione della Legge dei Grandi Numeri non riesce per una distribuzione di Cauchy, quindi non può avere un mezzo. Se si calcolano in media variabili casuali di Cauchy indipendenti, il risultato non converge in come con probabilità . Rimane una distribuzione di Cauchy della stessa dimensione. Questo è importante in ottica.0 n → ∞ 1
La distribuzione di Cauchy è l'intensità della luce normalizzata su una linea da una sorgente puntuale. Il principio di Huygens dice che puoi determinare l'intensità supponendo che la luce venga riemessa da qualsiasi linea tra la sorgente e il bersaglio. Pertanto, l'intensità della luce su una linea a metri di distanza può essere determinata assumendo che la luce colpisca per prima una linea a metro di distanza e venga riemessa con qualsiasi angolo in avanti. L'intensità della luce su una linea a metri di distanza può essere espressa come la convoluzione volte della distribuzione della luce su una linea a metro di distanza. Cioè, la somma di distribuzioni indipendenti di Cauchy è una distribuzione di Cauchy ridimensionata di un fattore di .1 n n 1 n n
Se la distribuzione di Cauchy avesse una media, allora il ° percentile della convoluzione fold diviso per dovrebbe convergere a secondo la Legge dei Grandi Numeri. Invece rimane costante. Se si segna il ° percentile su una linea (trasparente) a metro di distanza, metri di distanza, ecc., Questi punti formano una linea retta, a gradi. Non si piegano verso .n n 0 25 1 2 45 0
Questo ti dice in particolare della distribuzione di Cauchy, ma dovresti conoscere il test integrale perché ci sono altre distribuzioni senza mezzi che non hanno una chiara interpretazione fisica.
Risposta aggiunta in risposta al commento di @ whuber sulla risposta di Michael Chernicks (e riscritta completamente per rimuovere l'errore segnalato da whuber.)
Si dice che il valore dell'integrale per il valore atteso di una variabile casuale di Cauchy sia indefinito perché il valore può essere "fatto" per essere qualsiasi cosa ci piaccia. L'integrale (interpretato nel senso di un integrale di Riemann) è ciò che viene comunemente chiamato un integrale improprio e il suo valore deve essere calcolato come valore limite: o
Il valore principale di Cauchy è ottenuto come un unico limite: invece del doppio limite sopra. Il valore principale dell'integrale aspettativa è facilmente visibile per essere poiché il limitand ha valore per tutti . Ma questo non può essere usato per dire che la media di una variabile casuale di Cauchy è . Cioè, la media è definita come il valore dell'integrale nel senso comune e non nel senso del valore principale.
Per , considera invece l'integrale che si avvicina ad un valore limite di come . Quando , otteniamo il valore principale discusso sopra. Pertanto, non possiamo assegnare un significato inequivocabile all'espressione
Se si utilizza l'approccio teorico-misura alla probabilità e l'integrale del valore atteso è definito nel senso di un integrale di Lebesgue, allora il problema è più semplice. esiste solo quando è finito, quindi non è definito per una variabile casuale Cauchy poiché non è finito.
Mentre le risposte di cui sopra sono valide spiegazioni del perché la distribuzione di Cauchy non ha aspettative, trovo che il rapporto di due variate normali indipendenti sia Cauchy altrettanto illuminante: infatti, noi hanno e la seconda aspettativa è .
Il Cauchy non ha alcuna media perché il punto selezionato (0) non è una media. È una mediana e una modalità . La media per una distribuzione assolutamente continua è definita come dove è la funzione di densità e l'integrale viene assunto sul dominio di (che è a nel caso del Cauchy). Per la densità di Cauchy, questo integrale non è semplicemente finito (la metà da a è e la metà da a è ).f f - ∞ ∞ - ∞ 0 - ∞ 0 ∞ ∞
La distribuzione di Cauchy è meglio pensata come la distribuzione uniforme su un cerchio unitario, quindi sarebbe sorprendente se la media avesse un senso. Supponiamo che fosse una sorta di "funzione media". Cioè, supponiamo che, per ogni sottoinsieme finito del cerchio unitario, fosse un punto del cerchio unitario. Chiaramente, deve essere "innaturale". Più precisamente non può essere equivariante rispetto alle rotazioni. Per ottenere la distribuzione di Cauchy nella sua forma più consueta, ma meno rivelatrice, proiettare il cerchio unitario sull'asse x da (0,1) e utilizzare questa proiezione per trasferire la distribuzione uniforme sul cerchio sull'asse x.X f ( X ) f f
Per capire perché la media non esiste, pensa a x come una funzione nel cerchio unitario. È abbastanza facile trovare un numero infinito di archi disgiunti sul cerchio unitario, in modo tale che, se uno degli archi ha lunghezza d, allora x> 1 / 4d su quell'arco. Quindi ciascuno di questi archi disgiunti contribuisce per oltre 1/4 alla media e il contributo totale di questi archi è infinito. Possiamo fare di nuovo la stessa cosa, ma con x <-1 / 4d, con un contributo totale meno l'infinito. Questi intervalli potrebbero essere visualizzati con un diagramma, ma è possibile creare diagrammi per Convalida incrociata?
Il valore medio o atteso di una variabile casuale è un integrale di Lebesgue definito su una misura di probabilità : P E X = ∫ X d P
La non esistenza della media della variabile casuale di Cauchy significa semplicemente che l'integrale di Cauchy rv non esiste. Questo perché le code della distribuzione di Cauchy sono code pesanti (rispetto alle code della distribuzione normale). Tuttavia, la non esistenza del valore atteso non proibisce l'esistenza di altre funzioni di una variabile casuale di Cauchy.
Ecco più di una spiegazione visiva. (Per quelli di noi che sono sfidati in matematica.). Prendi un generatore di numeri casuali distribuito in modo cauchy e prova a calcolare la media dei valori risultanti. Ecco una buona pagina su una funzione per questo. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Scoprirai che la "punta" dei valori casuali fa sì che diventi più grande man mano che vai invece che più piccolo . Quindi non ha alcun mezzo.
Solo per aggiungere alle eccellenti risposte, farò alcuni commenti sul perché la non convergenza dell'integrale è rilevante per la pratica statistica. Come altri hanno già detto, se permettessimo che il valore principale fosse una "media", gli slln non sono più validi! A parte questo, pensa alle implicazioni del fatto che, in pratica, tutti i modelli sono approssimazioni. In particolare, la distribuzione di Cauchy è un modello per una variabile casuale illimitata. In pratica, le variabili casuali sono limitate, ma i limiti sono spesso vaghi e incerti. L'uso di modelli illimitati è un modo per alleviarlo, rende superflua l'introduzione di limiti non sicuri (e spesso innaturali) nei modelli. Ma perché ciò abbia un senso, aspetti importanti del problema non dovrebbero essere influenzati. Ciò significa che, se dovessimo introdurre limiti, ciò non dovrebbe alterare in modo importante il modello. Ma quando l'integrale è non convergente, ciò non accade! Il modello è instabile, nel senso che l'aspettativa del camper dipenderebbe da limiti ampiamente arbitrari. (Nelle applicazioni, non c'è necessariamente alcun motivo per rendere i limiti simmetrici!)
Per questo motivo, è meglio dire che l'integrale è divergente che dire che è "infinito", l'ultimo essendo vicino a implicare un valore definito quando non esiste! Una discussione più approfondita è qui .
Volevo essere un po 'esigente per un secondo. L'immagine in alto è sbagliata. L'asse x è in deviazioni standard, qualcosa che non esiste per la distribuzione di Cauchy. Sono pignolo perché uso la distribuzione di Cauchy ogni singolo giorno della mia vita nel mio lavoro. C'è un caso pratico in cui la confusione potrebbe causare un errore empirico. La distribuzione t di Student con 1 grado di libertà è lo standard Cauchy. Di solito elencherà i vari sigmi richiesti per il significato. Questi sigmi NON sono deviazioni standard, sono probabili errori e mu è la modalità.
Se si desidera eseguire correttamente il grafico sopra riportato, l'asse x è costituito da dati non elaborati o se si desidera che abbiano errori di dimensioni equivalenti, si otterrebbero gli stessi probabili errori. Un probabile errore è .67 deviazioni standard in termini di dimensioni sulla distribuzione normale. In entrambi i casi è la gamma semi-interquartile.
Ora, per quanto riguarda una risposta alla tua domanda, tutto ciò che tutti hanno scritto sopra è corretto ed è la ragione matematica per questo. Tuttavia, sospetto che tu sia uno studente e nuovo sull'argomento e quindi le soluzioni matematiche controintuitive all'ovvio visuale potrebbero non sembrare vere.
Ho due campioni del mondo reale quasi identici, tratti da una distribuzione di Cauchy, entrambi hanno la stessa modalità e lo stesso probabile errore. Uno ha una media di 1,27 e uno ha una media di 1,33. Quello con una media di 1,27 ha una deviazione standard di 400, quello con una media di 1,33 ha una deviazione standard di 5,15. L'errore probabile per entrambi è .32 e la modalità è 1. Ciò significa che per i dati simmetrici, la media non è nel 50% centrale. Basta una sola osservazione aggiuntiva per spingere la media e / o la varianza fuori dal significato per qualsiasi test. Il motivo è che la media e la varianza non sono parametri e la media del campione e la varianza del campione sono essi stessi numeri casuali.
La risposta più semplice è che i parametri della distribuzione di Cauchy non includono una media e quindi nessuna varianza rispetto a una media.
È probabile che nella pedagogia del passato l'importanza della media fosse in quanto di solito è una statistica sufficiente. Nelle statistiche a lungo termine basate sulla frequenza la distribuzione di Cauchy non ha statistiche sufficienti. È vero che la mediana del campione, per una distribuzione di Cauchy con supporto su tutti i reali, è una statistica sufficiente, ma è perché eredita da una statistica dell'ordine. È una specie di coincidenza sufficiente, privo di un modo semplice di pensarci. Ora nelle statistiche bayesiane esiste una statistica sufficiente per i parametri della distribuzione di Cauchy e se si utilizza un'uniforme precedente, anche questa è imparziale. Lo sostengo perché se devi usarli quotidianamente, hai imparato tutti i modi per eseguire delle stime su di essi.
Non esistono statistiche valide per gli ordini che possono essere utilizzate come stimatori per le distribuzioni troncate di Cauchy, che sono quelle che è probabile che si verifichino nel mondo reale, quindi non esiste una statistica sufficiente nei metodi basati sulla frequenza per la maggior parte, ma non per tutte le applicazioni del mondo reale .
Quello che suggerisco è di allontanarmi dal medio, mentalmente, come qualcosa di reale. È uno strumento, come un martello, che è ampiamente utile e di solito può essere utilizzato. A volte questo strumento non funzionerà.
Una nota matematica sulle distribuzioni normali e di Cauchy. Quando i dati vengono ricevuti come serie temporali, la distribuzione normale si verifica solo quando gli errori convergono in zero quando t va all'infinito. Quando i dati vengono ricevuti come serie temporali, la distribuzione di Cauchy avviene quando gli errori divergono all'infinito. Uno è dovuto a una serie convergente, l'altro a una serie divergente. Le distribuzioni di Cauchy non arrivano mai a un punto specifico al limite, oscillano avanti e indietro su un punto fisso in modo che il cinquanta percento delle volte si trovino da una parte e il cinquanta percento delle volte dall'altra. Non c'è inversione mediana.
Per dirla semplicemente, l'area sotto la curva si avvicina all'infinito mentre si esegue lo zoom indietro. Se campionate una regione finita, potete trovare una media per quella regione. Tuttavia, non esiste alcun mezzo per l'infinito.