Giustificazione del test di ipotesi a una coda


35

Capisco il test di ipotesi a due code. Hai (vs. H 1 = ¬ H 0 : θ θ 0 ). Il valore p è la probabilità che θ generi dati almeno estremi di quanto osservato.H0:θ=θ0H1=¬H0:θθ0pθ

Non capisco il test di ipotesi a una coda. Qui, (vs. H 1 = ¬ H 0 : θ > θ 0 ). La definizione di p-value non avrebbe dovuto cambiare dall'alto: dovrebbe comunque essere la probabilità che θ generi dati almeno estremi di quanto osservato. Ma non sappiamo θ , solo che è limitato da θ 0 .H0:θθ0H1=¬H0:θ>θ0θ θθ0

Quindi, invece, vedo testi che ci dicono di supporre che (non θ θ 0 come da H 0 ) e calcolare la probabilità che ciò generi dati almeno estremi di quanto osservato, ma solo da un lato. Questo sembra non avere nulla a che fare con le ipotesi, tecnicamente.θ=θ0θθ0H0

Ora capisco che si tratta di test di ipotesi per i frequentisti e che i frequentatori non pongono alcun priore sul proprio . Ma ciò non dovrebbe significare solo che le ipotesi sono quindi impossibili da accettare o rifiutare, piuttosto che mettere in ombra il calcolo di cui sopra nella figura?θ


Una domanda simile è stata posta in seguito stats.stackexchange.com/questions/8196/…
robin girard

1
La tua definizione del valore è incompleta. Dovrebbe leggere (enfasi aggiunta): il valore p è la probabilità che θ generi dati almeno estremi di quanto osservato, supponendo che l'ipotesi nulla sia vera . ppθ
Alexis,

Risposte:


34

Questa è una domanda premurosa. Numerosi testi (forse per motivi pedagogici) documentano questo problema. Quello che sta realmente succedendo è che è una "ipotesi" composita nella tua situazione unilaterale: in realtà è un insieme di ipotesi, non una singola. È necessario che per ogni possibile ipotesi in H 0H0 H0, la possibilità che la statistica del test cada nella regione critica deve essere inferiore o uguale alla dimensione del test. Inoltre, se il test deve effettivamente raggiungere la sua dimensione nominale (il che è una buona cosa per raggiungere un'alta potenza), allora il supremo di queste possibilità (preso su tutte le ipotesi nulle) dovrebbe essere uguale alla dimensione nominale. In pratica, per semplici test di un parametro di localizzazione che coinvolgono determinate famiglie di distribuzioni "belle", questo supremo si ottiene per l'ipotesi con il parametro . Quindi, in pratica, tutto il calcolo si concentra su questa unica distribuzione. Ma non dobbiamo dimenticare il resto del set H 0θ0H0: questa è una distinzione cruciale tra test su due lati e su un lato (e tra test "semplici" e "compositi" in generale).

Ciò influenza in modo sottile l'interpretazione dei risultati dei test unilaterali. Quando il nulla viene rifiutato, possiamo dire che l'evidenza indica che il vero stato della natura è una qualsiasi delle distribuzioni in . Quando il null non viene rifiutato, possiamo solo dire che esiste una distribuzione in H 0 che è "coerente" con i dati osservati. Siamo non dicendo che tutte le distribuzioni in H 0 sono coerenti con i dati: tutt'altro! Molti di essi possono produrre probabilità estremamente basse.H0H0H0


Tutto ciò che hai detto è valido e importante. Un altro aspetto importante che penso è che di solito l'ipotesi nulla è vista come l'ipotesi poco interessante. L'alternativa è vista come l'ipotesi scientifica. È quello che lo sperimentatore vorrebbe dimostrare. Dico di solito perché è diverso nei test di equivalenza e non inferiorità. Ora per quanto riguarda il problema dei test unilaterali, è solo la parte che ha un parametro maggiore del valore null che è interessante. Quindi tutti i valori sul lato inferiore sono incorporati nel valore nullo.
Michael R. Chernick il

stats.stackexchange.com/questions/333301/… Se hai voglia di dare una risposta a questa domanda o indicarmi una bibliografia ...;)
Un vecchio nel mare.

6

Vedo il valore come la massima probabilità di un errore di tipo I. Se θ θ 0 , la probabilità di un tasso di errore di tipo I può essere effettivamente zero, ma così sia. Quando si guarda il test da una prospettiva minimax, un avversario non trarrebbe mai dal profondo all'interno dell 'ipotesi nulla e il potere non dovrebbe essere influenzato. Per situazioni semplici (il test t , ad esempio) è possibile costruire un test con un tasso massimo di tipo I garantito, consentendo tali ipotesi nulle su un lato.pθθ0t


2

Utilizzeresti un test di ipotesi unilaterale se solo i risultati in una direzione supportano la conclusione che stai cercando di raggiungere.

Pensa a questo in termini di domanda che stai ponendo. Supponiamo, ad esempio, che tu voglia vedere se l'obesità porta ad un aumentato rischio di infarto. Raccogli i tuoi dati, che possono consistere in 10 persone obese e 10 persone non obese. Ora diciamo che, a causa di fattori di confondimento non registrati, scarsa progettazione sperimentale o semplicemente sfortuna, si osserva che solo 2 delle 10 persone obese hanno attacchi di cuore, rispetto a 8 delle persone non obese.

Ora, se si dovesse condurre un test di ipotesi su 2 lati su questi dati, si concluderebbe che esisteva un'associazione statisticamente significativa (p ~ 0,02) tra obesità e rischio di infarto. Tuttavia, l'associazione sarebbe nella direzione opposta a quella che ti aspettavi di vedere, quindi il risultato del test sarebbe fuorviante.

(Nella vita reale, un esperimento che ha prodotto un risultato così controintuitivo potrebbe portare a ulteriori domande di per sé interessanti: ad esempio, potrebbe essere necessario migliorare il processo di raccolta dei dati o potrebbero esserci al lavoro fattori di rischio precedentemente sconosciuti, oppure forse la saggezza convenzionale è semplicemente sbagliata, ma questi problemi non sono realmente correlati alla ristretta domanda su quale tipo di test di ipotesi usare.)


2

pH0H00.5H10.5

H0H00.75H10.25

H1H0H0

Puoi sperimentare questo esempio di giocattolo in R da solo, dovresti anche provare diversi numeri assoluti e combinazioni di teste e code:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.