Sì e no.
Innanzitutto il "sì"
Quello che hai osservato è che quando un test e un intervallo di confidenza si basano sulla stessa statistica, esiste un'equivalenza tra loro: possiamo interpretare il valore come il valore più piccolo di per il quale il valore null del parametro verrebbe incluso nell'intervallo di confidenza .α 1 - αpα1 - α
Consenti a essere un parametro sconosciuto nello spazio parametri e lascia che l'esempio è una realizzazione della variabile casuale . Per semplicità, definire un intervallo di confidenza come intervallo casuale tale che la sua probabilità di copertura
(Allo stesso modo si potrebbero considerare intervalli più generali, in cui la probabilità di copertura è delimitata o approssimativamente uguale a . Il ragionamento è analogo.)Θ ⊆ R x = ( x 1 , … , x n ) ∈ X n ⊆ R n X = ( X 1 , … , X n ) I α ( X ) P θ ( θ ∈ I α ( X ) ) = 1 - αθΘ ⊆ Rx =( x1, ... , xn) ∈ Xn⊆ RnX =( X1, ... , Xn)ioα( X )
1 - α
Pθ( θ ∈ Iα( X ) ) = 1 - αper tutto α∈(0,1).
1 - α
Si consideri un test fronte-retro dell'ipotesi punto-nullo rispetto all'alternativa . Let denota il valore p del test. Per ogni , viene rifiutato al livello if . Il livello regione di rifiuto è l'insieme di che porta al rifiuto di :
H 1 ( θ 0 ) : θ ≠ θ 0 λ ( θ 0 , x ) α ∈ ( 0 ,H0( θ0) : θ = θ0H1( θ0) : θ ≠ θ0λ ( θ0, x )H 0 ( θ 0 ) α λ ( θ 0 , x ) ≤ α α x H 0 ( θ 0 ) Rα ∈ ( 0 , 1 )H0( θ0)αλ ( θ0, x ) ≤ αα XH0( θ0)
Rα( θ0) = { x ∈ Rn: λ ( θ0, x ) ≤ α } .
Consideriamo ora una famiglia di test su due lati con valori p , per . Per una tale famiglia possiamo definire una regione di rifiuto invertitaθ ∈ Θ Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ ( θ , x )θ ∈ Θ
Qα( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .
Per qualsiasi fisso , viene rifiutato se , che si verifica se e solo se , cioè,
Se il test si basa su una statistica di test con una distribuzione nulla assolutamente continua completamente specificata, allora in . Quindi
Poiché questa equazione vale per qualsiasiH 0 ( θ 0 ) x ∈ R α ( θ 0 ) θ 0 ∈ Q α ( x ) x ∈ ) ) , Q αθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)λ ( θ 0 , X ) ∼ U ( 0 , 1 ) H 0 ( θ 0
x∈Rα(θ0)⇔θ0∈Qα(x).
λ(θ0,X)∼U(0,1)P θ 0 ( X ∈ R α ( θ 0 ) ) = P θ 0 ( λ ( θ 0 , X ) ≤ α ) = α . θ 0 ∈ Θ P θ 0 ( X ∈ R α ( θ 0 ) ) = P θ 0 ( θ 0 ∈ Q α ( XH0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θe poiché l'equazione sopra implica che ne consegue che l'insieme casuale copre sempre il vero parametro con probabilità . Di conseguenza, lasciando che denoti il complemento di , per tutti abbiamo
il che significa che il complemento della regione di rifiuto invertita è un intervallo di confidenza per .
Pθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
θ 0 α Q C α ( x ) Q α ( x ) θ 0 ∈ Θ P θ 0 ( θ 0 ∈ Q C α ( X ) ) = 1 - α , 1 - α θQα(x)θ0αQCα(x)Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
Di seguito viene fornita un'illustrazione, che mostra le regioni di rifiuto e gli intervalli di confidenza corrispondenti allo -test per una media normale, per diverse medie null e diverse medie campionarie , con . viene rifiutato se trova nella regione grigio chiaro ombreggiata. Viene mostrato in grigio scuro la regione di rifiuto e l'intervallo di confidenza .
θ ˉ x σ = 1 H 0 ( θ ) ( ˉ x , θ ) R 0.05 ( - 0.9 ) =zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Molto di questo è tratto dalla mia tesi di dottorato .)
Ora per il "no"
Sopra ho descritto il modo standard di costruire intervalli di confidenza. In questo approccio, utilizziamo alcune statistiche relative al parametro sconosciuto per costruire l'intervallo. Ci sono anche intervalli basati su algoritmi di minimizzazione, che cercano di ridurre al minimo la lunghezza della condizione intervallo sul valore di . Di solito, tali intervalli non corrispondono a un test.θX
Questo fenomeno ha a che fare con problemi legati al fatto che tali intervalli non vengono annidati, il che significa che l'intervallo del 94% può essere più breve dell'intervallo del 95%. Per ulteriori informazioni al riguardo, consultare la Sezione 2.5 di questo mio recente documento (che apparirà a Bernoulli).
E un secondo "no"
In alcuni problemi, l'intervallo di confidenza standard non si basa sulla stessa statistica del test standard (come discusso da Michael Fay in questo documento ). In questi casi, gli intervalli di confidenza e i test potrebbero non dare gli stessi risultati. Ad esempio, può essere rifiutato dal test anche se 0 è incluso nell'intervallo di confidenza. Ciò non contraddice il "sì" sopra, poiché vengono utilizzate statistiche diverse.θ0=0
E a volte "sì" non è una buona cosa
Come sottolineato da F Coppens in un commento, a volte intervalli e test hanno obiettivi alquanto contrastanti. Vogliamo brevi intervalli e test con alta potenza, ma l'intervallo più breve non corrisponde sempre al test con la massima potenza. Per alcuni esempi di questo, vedi questo documento (distribuzione normale multivariata), o questo (distribuzione esponenziale), o la Sezione 4 della mia tesi .
I bayesiani possono anche dire sia sì che no
Alcuni anni fa, ho pubblicato qui una domanda sull'esistenza di un'equivalenza intervallo di prova anche nelle statistiche bayesiane. La risposta breve è che usando il test di ipotesi bayesiana standard, la risposta è "no". Riformulando un po 'il problema dei test, la risposta può essere comunque "sì". (I miei tentativi di rispondere alla mia domanda alla fine si sono trasformati in un documento !)