Sì, possiamo ottenere un risultato analogo usando la media del campione e la varianza, con forse un paio di piccole sorprese emergenti nel processo.
Innanzitutto, dobbiamo perfezionare un po 'l'affermazione della domanda e formulare alcune ipotesi. È importante sottolineare che dovrebbe essere chiaro che non possiamo sperare di sostituire la varianza della popolazione con la varianza del campione sul lato destro poiché quest'ultima è casuale ! Quindi, focalizziamo nuovamente la nostra attenzione sulla disuguaglianza equivalente
Nel caso in cui non sia chiaro che siano equivalenti, si noti che abbiamo semplicemente sostituito con nella disuguaglianza originale senza alcuna perdita di generalità.t t σ
P(X−EX≥tσ)≤11+t2.
ttσ
In secondo luogo, supponiamo di avere un campione casuale e siamo interessati a un limite superiore per la quantità analoga
, dove è il campione media e è la deviazione standard del campione.P ( X 1 - ˉ X ≥ t S ) ˉ X SX1,…,XnP(X1−X¯≥tS)X¯S
Un mezzo passo avanti
Nota che già applicando la disuguaglianza di Chebyshev unilaterale originale a , otteniamo che
dove , che è più piccolo del lato destro della versione originale. Questo ha senso! Qualsiasi realizzazione particolare di una variabile casuale da un campione tenderà ad essere (leggermente) più vicina alla media del campione a cui contribuisce rispetto alla media della popolazione. Come vedremo di seguito, sostituiremo con con ipotesi ancora più generali. P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1−X¯σ2=Var(X1)σS
P(X1−X¯≥tσ)≤11+nn−1t2
σ2=Var(X1)σS
Una versione di esempio di Chebyshev unilaterale
Reclamo : Siano un campione casuale tale che . Quindi,In particolare, la versione di esempio del limite è più stretta della versione originale della popolazione.P ( S = 0 ) = 0 P ( X 1 - ˉ X ≥ t S ) ≤ 1X1,…,XnP(S=0)=0
P(X1−X¯≥tS)≤11+nn−1t2.
Nota : non assumiamo che abbia una media o una varianza finite!Xi
Prova . L'idea è di adattare la prova della disuguaglianza originale di Chebyshev unilaterale e impiegare la simmetria nel processo. Innanzitutto, impostare per comodità notazionale. Quindi, osserva che
P ( Y 1 ≥ t S ) = 1Yi=Xi−X¯
P(Y1≥tS)=1n∑i=1nP(Yi≥tS)=E1n∑i=1n1(Yi≥tS).
Ora, per qualsiasi , su ,
{ S > 0 } 1 ( Y i ≥ tc>0{S>0}
1( Yio≥ t S)= 1( Yio+ t c S≥ t S( 1 + c ) )≤ 1( ( Yio+ t c S)2≥ t2( 1 + c )2S2)≤ ( Yio+ t c S)2t2( 1 + c )2S2.
Quindi,
poiché e .
1nΣio1( Yio≥ t S)≤ 1nΣio( Yio+ t c S)2t2( 1 + c)2S2= ( n - 1 ) S2+ n t2c2S2n t2( 1 + c )2S2= ( n - 1 ) + n t2c2n t2( 1 + c )2,
Y¯= 0ΣioY2io= ( n - 1 ) S2
Il lato destro è una costante ( ! ), Quindi prendendo le aspettative da entrambi i lati si ottiene,
Infine, minimizzando su , si ottiene , che dopo una piccola algebra stabilisce il risultato.
P ( X1- X¯≥ t S) ≤ ( n - 1 ) + n t2c2n t2( 1 + c )2.
cc = n - 1n t2
Quella fastidiosa condizione tecnica
Si noti che abbiamo dovuto assumere per poter dividere per nell'analisi. Questo non è un problema per le distribuzioni assolutamente continue, ma rappresenta un inconveniente per quelle discrete. Per una distribuzione discreta, c'è una certa probabilità che tutte le osservazioni siano uguali, nel qual caso per tutte e .P (S= 0 ) = 0S20 = Yio= t S= 0iot > 0
Possiamo spostarci uscendo impostando . Quindi, un'attenta contabilità dell'argomento mostra che tutto passa praticamente invariato e otteniamoq= P (S= 0 )
Corollario 1 . Nel caso , abbiamoq= P (S= 0 ) > 0
P ( X1- X¯≥ tS) ≤ ( 1 -q) 11 + nn - 1t2+ q.
Prova . Dividi sugli eventi e . La prova precedente viene eseguita per e il caso è banale.{ S> 0 }{ S= 0 }{ S> 0 }{ S= 0 }
Una disuguaglianza leggermente più pulita risulta se sostituiamo la disuguaglianza non rigorosa nella dichiarazione di probabilità con una versione rigorosa.
Corollario 2 . Sia (possibilmente zero). Quindi,q= P ( S= 0 )
P ( X1- X¯> t S) ≤ ( 1 - q) 11 + nn - 1t2.
Osservazione finale : La versione di esempio di disuguaglianza necessaria alcuna ipotesi su (a parte che non sia quasi certamente costante nel caso nonstrict disuguaglianza, che la versione originale anche tacitamente assume), in sostanza, in quanto il campione medio e campione varianza esiste sempre indipendentemente dal fatto che i loro analoghi di popolazione lo facciano o meno.X