Possiamo rifiutare un'ipotesi nulla con intervalli di confidenza prodotti tramite campionamento piuttosto che l'ipotesi nulla?


9

Mi è stato insegnato che possiamo produrre una stima dei parametri sotto forma di un intervallo di confidenza dopo il campionamento da una popolazione. Ad esempio, gli intervalli di confidenza al 95%, senza ipotesi violate, dovrebbero avere un tasso di successo del 95% di contenere qualunque sia il vero parametro che stiamo stimando nella popolazione.

Vale a dire,

  1. Produrre una stima puntuale da un campione.
  2. Produrre un intervallo di valori che teoricamente ha una probabilità del 95% di contenere il valore reale che stiamo cercando di stimare.

Tuttavia, quando l'argomento è passato al test delle ipotesi, i passaggi sono stati descritti come segue:

  1. Assumi alcuni parametri come ipotesi nulla.
  2. Produrre una distribuzione di probabilità della probabilità di ottenere varie stime puntuali dato che questa ipotesi nulla è vera.
  3. Rifiuta l'ipotesi nulla se la stima puntuale che otteniamo verrebbe prodotta meno del 5% delle volte se l'ipotesi nulla fosse vera.

La mia domanda è questa:

È necessario produrre i nostri intervalli di confidenza usando l'ipotesi nulla per respingere il nulla? Perché non fare solo la prima procedura e ottenere la nostra stima per il parametro vero (non usando esplicitamente il nostro valore ipotizzato nel calcolo dell'intervallo di confidenza), quindi rifiutando l'ipotesi nulla se non rientra in questo intervallo?

Questo sembra logicamente equivalente a me intuitivamente, ma temo che mi manchi qualcosa di molto fondamentale poiché probabilmente c'è una ragione per cui viene insegnato in questo modo.


Mi scuso per non essere chiaro, Martijn. Modificherò il mio post a breve in modo che sia più chiaro per le persone che cercano le stesse domande in futuro. Quello che intendevo dire è che possiamo calcolare una stima dei parametri da un campione, oppure possiamo calcolare un intervallo di stime che riterremmo supportare l'ipotesi nulla usando l'ipotesi nulla. Non capivo perché fosse necessario utilizzare il valore nullo per vedere se la nostra stima puntuale fosse in questo intervallo, piuttosto che semplicemente usare la nostra stima dei parametri e verificare se il valore nullo rientrava nei limiti della stima dei parametri. Spero che abbia un senso!
Nikli,

Un interessante esperimento mentale è se qualcuno cerca di venderti dadi ponderati. Li rotolano, quindi dichiarano che sono ponderati nella direzione che osservi (ad es. 6 aumenta del 20% delle volte). Sono ponderati (sono stati fatti abbastanza tiri di campionamento), in che misura e quanto vale fare i propri test (extra) di lancio dei dadi? Il venditore e l'acquirente hanno obiettivi diversi ...
Philip Oakley,

Risposte:


5

Un semplice problema, a titolo di esempio, è dato dal test per la media di una popolazione normale con varianza nota . Quindi, un perno - una quantità la cui distribuzione non dipende dal parametro, è data da . I valori critici soddisfano, in questo caso simmetrico, e .ˉ Y - μ N ( 0 , 1 / n ) z α / 2 Φ ( - z α / 2 ) = α / 2 Φ ( z α / 2 ) = 1 - α / 2σ2=1Y¯μN(0,1/n)zα/2Φ(-zα/2)=α/2Φ(zα/2)=1-α/2

Quindi, modo che è un intervallo di confidenza del livello .(ˉX-zα/2/

1-α=Pr{(X¯-μ)/(1/n)(-zα/2,zα/2)}=Pr{-zα/2(X¯-μ)nzα/2}=Pr{zα/2(μ-X¯)n-zα/2}=Pr{-zα/2/nμ-X¯zα/2/n}=Pr{X¯-zα/2/nμX¯+zα/2/n}=Pr{(X¯-zα/2/n,X¯+zα/2/n)μ}
1-α
(X¯-zα/2/n,X¯+zα/2/n)
1-α

Allo stesso tempo, l'evento nella prima riga del display è precisamente anche l'evento in cui l'ipotesi nulla non è respinta per questo . Poiché il resto contiene solo riformulazioni equivalenti, ci contiene effettivamente tutto per cui il null non viene rifiutato e non è necessario alcun riferimento a "under the null".μμμ

Ecco una trama analoga alla visualizzazione +1 di Martijn che mira a mostrare ciò che è noto come dualità tra intervalli di confidenza e test. indica l'intervallo di confidenza appartenente ad alcuni e la regione di accettazione appartenente ad alcune ipotesi .ˉ x A ( μ 0 ) μ = μ 0CX¯*UN(μ0)μ=μ0

inserisci qui la descrizione dell'immagine


10

Sì, è possibile sostituire un test di ipotesi (confrontando il campione con una distribuzione ipotetica dei risultati del test) con un confronto con un intervallo di confidenza calcolato dal campione. Ma indirettamente un intervallo di confidenza è già una sorta di test di ipotesi, vale a dire:

  • Potresti vedere gli intervalli di confidenza come costruiti come un intervallo di valori per i quali un test di ipotesi a livello avrebbe esito positivoα e al di fuori dell'intervallo un test di ipotesi a livello fallirebbe.α

La conseguenza della creazione di tale intervallo è che l'intervallo fallisce solo una frazione del tempo.α

Esempio

Sto usando un'immagine da una risposta alla seguente domanda: Intervalli di confidenza: come gestire formalmenteP(L(X)θ,U(X)θ)=1-α

È una variazione di un grafico di Clopper-Pearson . Immaginate il caso di 100 prove di Bernoulli in cui la probabilità di successo è e si osserva il numero totale di successi .θX

probabilità fiduciale

Nota che:

  • Nella direzione verticale vedi test di ipotesi. Ad esempio per un dato valore ipotizzato si rifiuta l'ipotesi se la misurata è sopra o sotto le linee tratteggiate rosse o verdi.θX

  • In direzione orizzontale vengono visualizzati gli intervalli di confidenza di Clopper-Pearson. Se per una data osservazione X usi questi intervalli di confidenza, ti sbaglierai solo il 5% delle volte

    (perché osserverai solo tale X, su cui baserai un intervallo 'sbagliato', il 5% delle volte)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.