Esiste una versione di esempio della disuguaglianza di Chebyshev unilaterale?


32

Sono interessato alla seguente versione unilaterale di Cantelli della disuguaglianza di Chebyshev :

P(XE(X)t)Var(X)Var(X)+t2.

Fondamentalmente, se conosci la media e la varianza della popolazione, puoi calcolare il limite superiore sulla probabilità di osservare un certo valore. (Questa era la mia comprensione almeno.)

Tuttavia, vorrei utilizzare la media e la varianza del campione anziché la media e la varianza effettive della popolazione.

Immagino che dal momento che ciò introdurrebbe maggiore incertezza, il limite superiore aumenterebbe.

Esiste una disuguaglianza analoga a quanto sopra, ma che utilizza la media e la varianza del campione?

Modifica : l'analogo "campione" della disuguaglianza di Chebyshev (non un lato), è stato elaborato. La pagina di Wikipedia ha alcuni dettagli. Tuttavia, non sono sicuro di come si tradurrebbe nel caso unilaterale che ho sopra.


Grazie Glen_b. È un problema piuttosto interessante. Ho sempre pensato che la disuguaglianza di Chebyshev fosse potente (dal momento che ti permette di fare inferenza statistica senza richiedere una distribuzione di probabilità); quindi essere in grado di usarlo con la media del campione e la varianza sarebbe piuttosto fantastico.
Casandra,

Risposte:


26

Sì, possiamo ottenere un risultato analogo usando la media del campione e la varianza, con forse un paio di piccole sorprese emergenti nel processo.

Innanzitutto, dobbiamo perfezionare un po 'l'affermazione della domanda e formulare alcune ipotesi. È importante sottolineare che dovrebbe essere chiaro che non possiamo sperare di sostituire la varianza della popolazione con la varianza del campione sul lato destro poiché quest'ultima è casuale ! Quindi, focalizziamo nuovamente la nostra attenzione sulla disuguaglianza equivalente Nel caso in cui non sia chiaro che siano equivalenti, si noti che abbiamo semplicemente sostituito con nella disuguaglianza originale senza alcuna perdita di generalità.t t σ

P(XEXtσ)11+t2.
ttσ

In secondo luogo, supponiamo di avere un campione casuale e siamo interessati a un limite superiore per la quantità analoga , dove è il campione media e è la deviazione standard del campione.P ( X 1 - ˉ Xt S ) ˉ X SX1,,XnP(X1X¯tS)X¯S

Un mezzo passo avanti

Nota che già applicando la disuguaglianza di Chebyshev unilaterale originale a , otteniamo che dove , che è più piccolo del lato destro della versione originale. Questo ha senso! Qualsiasi realizzazione particolare di una variabile casuale da un campione tenderà ad essere (leggermente) più vicina alla media del campione a cui contribuisce rispetto alla media della popolazione. Come vedremo di seguito, sostituiremo con con ipotesi ancora più generali. P ( X 1 - ˉ Xt σ ) 1X1X¯σ2=Var(X1)σS

P(X1X¯tσ)11+nn1t2
σ2=Var(X1)σS

Una versione di esempio di Chebyshev unilaterale

Reclamo : Siano un campione casuale tale che . Quindi,In particolare, la versione di esempio del limite è più stretta della versione originale della popolazione.P ( S = 0 ) = 0 P ( X 1 - ˉ Xt S ) 1X1,,XnP(S=0)=0

P(X1X¯tS)11+nn1t2.

Nota : non assumiamo che abbia una media o una varianza finite!Xi

Prova . L'idea è di adattare la prova della disuguaglianza originale di Chebyshev unilaterale e impiegare la simmetria nel processo. Innanzitutto, impostare per comodità notazionale. Quindi, osserva che P ( Y 1t S ) = 1Yi=XiX¯

P(Y1tS)=1ni=1nP(YitS)=E1ni=1n1(YitS).

Ora, per qualsiasi , su , { S > 0 } 1 ( Y itc>0{S>0}

1(YitS)=1(Yi+tcStS(1+c))1((Yi+tcS)2t2(1+c)2S2)(Yi+tcS)2t2(1+c)2S2.

Quindi, poiché e .

1ni1(YitS)1ni(Yi+tcS)2t2(1+c)2S2=(n1)S2+nt2c2S2nt2(1+c)2S2=(n1)+nt2c2nt2(1+c)2,
Y¯=0iYi2=(n1)S2

Il lato destro è una costante ( ! ), Quindi prendendo le aspettative da entrambi i lati si ottiene, Infine, minimizzando su , si ottiene , che dopo una piccola algebra stabilisce il risultato.

P(X1X¯tS)(n1)+nt2c2nt2(1+c)2.
cc=n1nt2

Quella fastidiosa condizione tecnica

Si noti che abbiamo dovuto assumere per poter dividere per nell'analisi. Questo non è un problema per le distribuzioni assolutamente continue, ma rappresenta un inconveniente per quelle discrete. Per una distribuzione discreta, c'è una certa probabilità che tutte le osservazioni siano uguali, nel qual caso per tutte e .P(S=0)=0S20=Yi=tS=0it>0

Possiamo spostarci uscendo impostando . Quindi, un'attenta contabilità dell'argomento mostra che tutto passa praticamente invariato e otteniamoq=P(S=0)

Corollario 1 . Nel caso , abbiamoq=P(S=0)>0

P(X1X¯tS)(1q)11+nn1t2+q.

Prova . Dividi sugli eventi e . La prova precedente viene eseguita per e il caso è banale.{S>0}{S=0}{S>0}{S=0}

Una disuguaglianza leggermente più pulita risulta se sostituiamo la disuguaglianza non rigorosa nella dichiarazione di probabilità con una versione rigorosa.

Corollario 2 . Sia (possibilmente zero). Quindi,q=P(S=0)

P(X1X¯>tS)(1q)11+nn1t2.

Osservazione finale : La versione di esempio di disuguaglianza necessaria alcuna ipotesi su (a parte che non sia quasi certamente costante nel caso nonstrict disuguaglianza, che la versione originale anche tacitamente assume), in sostanza, in quanto il campione medio e campione varianza esiste sempre indipendentemente dal fatto che i loro analoghi di popolazione lo facciano o meno.X


15

Questo è solo un complemento alla geniale risposta di @cardinal. Samuelson Inequality , afferma che, per un campione di dimensione , quando abbiamo almeno tre valori distinti degli realizzati , sostiene che dove viene calcolato senza la correzione del bias, .nxi

xix¯<sn1,i=1,...n
ss=(1ni=1n(xix¯)2)1/2

Quindi, usando la notazione della risposta del Cardinale possiamo affermarlo

P(X1X¯Sn1)=0a.s.[1]

Poiché abbiamo bisogno di tre valori distinti, avremo per ipotesi. Quindi impostando in Cardinal's Inequality (la versione iniziale) otteniamoS0t=n1

P(X1X¯Sn1)11+n,[2]

Eq. è ovviamente compatibile con l'eq. . La combinazione dei due ci dice che la disuguaglianza del cardinale è utile come affermazione probabilistica per . [2][1]0<t<n1

Se la disuguaglianza del Cardinale richiede che sia calcolato con correzione di bias (chiama questa ), allora le equazioni diventanoSS~

P(X1X¯S~n1n)=0a.s.[1a]

e scegliamo da ottenere attraverso la disuguaglianza del Cardinalet=n1n

P(X1X¯S~n1n)1n,[2a]
e l'intervallo probabilisticamente significativo per èt0<t<n1n.

2
(+1) Per inciso, mentre stavo considerando questo problema per la prima volta, il fatto che era in realtà l'indizio iniziale che la disuguaglianza del campione dovesse essere più stretta dell'originale. Volevo inserirlo nel mio post, ma non sono riuscito a trovare un posto (comodo) per questo. Sono contento di vederti menzionarlo (in realtà un leggero miglioramento) insieme alla tua molto bella elaborazione aggiuntiva. Saluti. maxi|XiX¯|Sn1
cardinale il

Saluti @Cardinal, ottima risposta, basta chiarirmi, importa per la vostra disuguaglianza come si definisce la varianza del campione (corretta o no)?
Alecos Papadopoulos,

Solo così leggermente. Ho usato la varianza del campione corretta da bias. Se usi invece di per normalizzare, finirai con invece di che significa che il termine nella disuguaglianza finale scomparirà. Pertanto, in questo caso otterrai lo stesso limite della disuguaglianza di Chebyshev unilaterale originale. (Supponendo di aver eseguito correttamente l'algebra.) :-)n1 + t 2 c 2n1
1+t2c2t2(1+c)2
n / ( n - 1
(n1)+nt2c2nt2(1+c)2,
n/(n1)
Cardinale

@ Cardinale ... il che significa che le equazioni rilevanti nella mia risposta sono e , il che significa che la tua disuguaglianza ci dice che per scelto di attivare la disuguaglianza di Samuelson, la probabilità dell'evento che stiamo esaminando, non può essere maggiore di , cioè non superiore alla scelta casuale di qualsiasi valore realizzato dal campione ... che in qualche modo ha un certo senso intuitivo nebuloso: ciò che è certamente impossibile in termini deterministici, quando avvicinato probabilisticamente il suo limite di probabilità non supera l'equipaggiamento ... non chiaro nella mia mente ancora. 2 a t 1 / n1a2at1/n
Alecos Papadopoulos,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.