Prova che


8

I problemi statistici che coinvolgono intervalli di confidenza per una media della popolazione possono essere inquadrati in termini della seguente funzione di ponderazione :

w(α,n)tn-1,α/2nper 0<α<1 e n>1.

Ad esempio, l' intervallo di confidenza standard classico a livello per la media di una superpopolazione infinita può essere scritto come:1-α

CI(1-α)=[X¯n±w(α,n)Sn].

È banale stabilire i limiti limα0w(α,n)=e limα1w(α,n)=0 usando la funzione quantile della distribuzione T. Nel contesto degli intervalli di confidenza, questo ci dice che l'intervallo si riduce a un singolo punto mentre diminuiamo il livello di confidenza e aumenta a tutta la linea reale mentre aumentiamo il livello di confidenza. Un'altra proprietà intuitiva che dovrebbe contenere è che l'intervallo si riduce a un singolo punto man mano che otteniamo sempre più dati, il che significa che:

limnw(α,n)=0.

Domanda: fornire una prova per quest'ultima proprietà della funzione di ponderazione.


Ulteriori informazioni: Per tutti i lettori matematici che non hanno familiarità con i punti critici della distribuzione T , il valore è una funzione di definita dall'equazione implicita:tn1,α/2n

α2=1(n1)πΓ(n2)Γ(n12)tn1,α/2(1+r2n1)n/2dr.

2
Questo non è banale a causa del fatto che gli studenti convergono in una normale variazione totale? Il numeratore va alla costante . zα/2
ragazzo,

1
@guy: ciò che costituisce "banale" dipende dal livello della persona che stai chiedendo. Il motivo per cui faccio questa domanda è che questo è un problema che ho posto a un paio di studenti universitari nel mio insegnamento e voglio vedere che tipo di prove vengono presentate dalle persone su questo sito (quindi posso confrontare questo con il tipi di risposte fornite dagli studenti). I laureati di solito hanno una vaga idea di come affrontare la prova, ma lottano con i dettagli. La maggior parte prova a mostrare e va da lì, ma altri cercano di risolverlo stabilendo un limite sull'integrale. tn1,α/2zα/2<
Ben - Ripristina Monica il

(Spero anche di vedere la prova più elegante, come un buon modo per presentare il risultato.)
Ben - Ripristina Monica

2
Sarei interessato a vedere quanto elegante qualcuno può ottenere questo. Opinione personale, ma direi che usare le densità non è elegante perché porta in una struttura aggiuntiva che non è necessaria. La prova nella mia risposta ha due lezioni importanti. Innanzitutto, la proposta è un utile pezzo di teoria della probabilità e può dare un'idea di come si comportano i DF. In secondo luogo, la tecnica di correzione (che può essere riformulata in termini di numeri di copertura) è molto utile per dimostrare molte cose.
ragazzo

Risposte:


4

Prova con la disuguaglianza di Chebyshev

Ecco una prova usando la disuguaglianza di Chebyshev .Pr(|T|kσ)1k2

Se e impostiamo quindi abbiamo un limiteσtν=νν21/k2=α=Pr(|T|tν,α/2)

Pr(|T|νν-21α)Pr(|T|tν,α/2)

quindi sarà limitato datν,α/2

tν,α/2νν-21α

aggiungendo il limite inferiore evidente e dividi perν+1

0tn-1,α/2ν+1νν+1(ν-2)1α

che stringe a zero pertn-1,α/2/nn


Di solito evito i commenti "bella risposta" ma questo è davvero elegante! (+1 ovviamente!)
usεr11852

1
@ usεr11852 ti potrebbe piacere la mia prova geometrica in cui la distribuzione della statistica t è correlata alla distribuzione di un angolo nello spazio n.
Sesto Empirico

4

Sono sicuro che esiste un modo più semplice per farlo, ma il risultato è immediato da quanto segue:

Proposizione: Sia una funzione di distribuzione continua e una sequenza di funzioni di distribuzione tale che debolmente (cioè nella distribuzione). Quindi da uniformemente in .FFnFnFFn(X)F(X)X

Prova: usando la continuità e la monotonia, per qualsiasi numero naturale possiamo selezionare tale che (prendendo e ). A causa della debole convergenza e del fatto che è continuo, da . Per ogni , trova un intervallo contenente e nota che . Quindi e perché era arbitrario otteniamomX0,X1,...,XmF(Xj)=j/mX0=-Xm=FFn(Xj)F(Xj)y[Xj-1,Xj]y|Fn(y)-F(y)|cenarej|Fn(Xj)-F(Xj)|+|F(Xj)-F(Xj-1)|1mlim¯ncenarey|Fn(y)-F(y)|1mmcenarey|Fn(y)-F(y)|0 .

Successivamente, è una nota applicazione del teorema di Slutsky che converge nella distribuzione in una distribuzione normale standard. Il risultato precedente implica che , ovvero . Applicando la normale funzione quantile su entrambi i lati, otteniamo .tn-1Fn(tn-1,α)-F(tn-1,α)0F(tn-1,α)αtn-1,αzα

Da qui implica per qualsiasi (in particolare, ).tn-1,αzαtn-1,αg(n)0g(n)g(n)=n


3

Prova geometrica

Vista geometrica

Considera il campione osservato come un punto nello spazio euclideo n-dimensionale e la stima della media come la proiezione di un'osservazione sulla linea del modello .X1,X2,...,XnX1=X2=...=Xn=X¯

Il punteggio t può essere espresso come rapporto di due distanze in questo spazio

  • la distanza tra il punto proiettato e la media della popolazione
    n(X¯-μ)
  • la distanza tra questo punto e l'osservazione
    Σio=1n(X^-Xio)2

Ciò è correlato alla tangente dell'angolo tra l'osservazione e la linea su cui viene proiettata.

tn-1=n(X¯-μ)Σio=1n(X^-Xio)2=1abbronzaturaθ

Schizzo geometrico

Distribuzione t di equivalenza e distribuzione dell'angolo

In questa vista geometrica la probabilità che il punteggio t sia superiore a un certo valore equivale alla probabilità che l' angolo sia inferiore a un certo valore:

Pr(|T|>tn-1,α/2)=2Pr(θθν,α)=α

O

tn-1,α/2n-1=1abbronzaturaθν,α

Si potrebbe dire che il punteggio t si riferisce all'angolo dell'osservazione con la linea del modello teorico. Per i punti al di fuori dell'intervallo di confidenza (quindi è più lontano da e l'angolo sarà più piccolo) l'angolo sarà sotto un limite . Questo limite cambierà con più osservazioni. Se il limite di questo angolo va a 90 gradi per grande (la forma del cono diventa più piatta, cioè meno appuntita e lunga), ciò significa che la dimensione dell'intervallo di confidenza si riduce e si avvicina zero.μX¯θν,αθν,αn

angolo vs t

Distribuzione dell'angolo come area relativa del cappuccio di una n-sfera

A causa della simmetria della distribuzione di probabilità congiunta di variabili distribuite normali indipendenti, ogni direzione è ugualmente probabile e la probabilità che l'angolo si trovi all'interno di una determinata regione è uguale all'area relativa del cappuccio di una n-sfera.

L'area relativa di questo n-cap si trova integrando l'area di un n-frustum :

2Pr(θθc)=211+abbronzatura(θc)21(1-X2)n-32B(12,n-12)dX=11+abbronzatura(θc)21t-0.5(1-t)n-32B(12,n-12)dt=io11+abbronzatura(θc)2(12,n-12)

dove è la funzione beta incompleta regolarizzata superiore.ioX(,)

Limite di angolo

Se va a 90 gradi per allora va a zero.θn,αntn-1,α/2/n

O un'istruzione inversa: per qualsiasi angolo inferiore a 90 gradi l'area relativa di quell'angolo su una n-sfera, diminuisce a zero quando va all'infinito.n

Intuitivamente ciò significa che tutta l'area di una sfera n si concentra sull'equatore quando la dimensione aumenta all'infinito.n

Quantitativamente possiamo mostrarlo usando l'espressione

un'1t-0.5(1-t)n-32B(12,n-12)dt<un'1(1-un')n-32B(12,n-12)dt=(1-un')n-12B(12,n-12)=L(n)

e considera la differenza tra e .L(n+2)L(n)

Ad un certo punto la diminuzione del denominatore sarà assunto dalla riduzione del numeratore e la funzione diminuisce a zero per all'infinito.

B(12,X+1)B(12,X)=XX+12
(1-un')n+12(1-un')n-12=1-un'
L(n)n

1

abbiamo

α2=tn-1,α/2limn1(n-1)πΓ(n2)Γ(n-12)(1+r2n-1)-n/2dr=tn-1,α/212πe-12r2dr=1-Φ(tn-1,α/2)1-[12+φ(tn-1,α/2)(tn-1,α/2+(tn-1,α/2)33+(tn-1,α/2)515+...)]

il che implica che il secondo termine tra parentesi quadre può essere al massimo poiché il massimo può essere è . Nota che è il pdf della distribuzione normale. Anche questa approssimazione si basa su questo .12α1φ(X)

Quindi

0<α1+2φ(tn-1,α/2)(tn-1,α/2+(tn-1,α/2)33+(tn-1,α/2)515+...)<1

Benvenuto nel sito, @guerhuerh. Prendi in considerazione la possibilità di registrare il tuo account e diventare un membro regolare qui (ci sono informazioni nella sezione Il mio account del nostro centro assistenza ). Ci piacerebbe averti. Se lo desideri, puoi partecipare al nostro tour , che contiene informazioni per i nuovi utenti.
gung - Ripristina Monica

2
Questo è un approccio interessante, ma non mi è chiaro come si giustifica il primo passo (in cui è stata aggiunta l'operazione limite all'interno dell'integrale). Ciò fornisce un'equazione implicita per che è falsa. tn-1,α/2
Ben - Ripristina Monica il

@Ben: ? limnα2=α2
PEV

@PEV: Sì, ma il lato destro dovrebbe avere il limite al di fuori dell'integrale, non al suo interno. Poiché i limiti nell'integrale dipendono da il lato destro è attualmente una funzione di , quindi non è uguale a . nnα/2
Ben - Ripristina Monica il

@PEV: Penso che il metodo possa essere modificato separando l'integrale in due parti, una che sostituisce il limite inferiore con e una che fornisce il resto. Il primo converrebbe quindi in ciò che è già mostrato e dovremmo quindi dimostrare che il secondo converge a zero. Come ho detto, penso che questo sia un approccio interessante. Potrebbe avere merito come metodo e potrebbe essere modificato per essere corretto, ma al momento non è corretto. zα/2
Ben - Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.