Come specificare l'ipotesi nulla nel test di ipotesi


15

Qual è una buona regola empirica per come scegliere la domanda per l'ipotesi nulla. Ad esempio, se voglio verificare se l'ipotesi B è vera, dovrei usare B come null, B come ipotesi alternativa o NOT B come null? Spero che la domanda sia chiara. So che ha qualcosa a che fare con l'errore che voglio minimizzare (Tipo I?), Ma continuo a dimenticare come va, perché non ho una chiara intuizione costruita per questo. Grazie.


Ragazzi ... risposte eccellenti. Tutto utile Mi sorprende ancora quando ottengo questo livello di collaborazione sul web, solo perché le persone sono interessate. Wow grazie !
Nestor,

Risposte:


17

Una regola empirica di un mio buon consigliere era quella di impostare l'ipotesi nulla sul risultato che non si desidera essere vero, cioè il risultato di cui si desidera mostrare l'opposto diretto.

Esempio di base: supponiamo di aver sviluppato un nuovo trattamento medico e di voler dimostrare che è davvero meglio del placebo. Quindi si imposta l'ipotesi nulla nuovo trattamento è uguale o peggiore del placebo e l'ipotesi alternativa H 1 : = il nuovo trattamento è migliore del placebo.H0:=H1:=

Questo perché nel corso di un test statistico o rifiuti l'ipotesi nulla (e favorisci l'ipotesi alternativa) o non puoi rifiutarla. Dato che il tuo "obiettivo" è rifiutare l'ipotesi nulla, la imposti sul risultato che non vuoi essere vero.

Nota a margine: sono consapevole che non si dovrebbe impostare un test statistico per distorcerlo e romperlo fino a quando l'ipotesi nulla è stata respinta, il linguaggio casuale è stato usato solo per rendere questa regola più facile da ricordare.

Anche questo può essere utile: qual è il significato dei valori p e t nei test statistici? e / o qual è una buona introduzione al test delle ipotesi statistiche per gli informatici?


6

Se l'ipotesi B è l'ipotesi interessante, puoi prendere la non-B come ipotesi nulla e controllare, sotto lo zero, la probabilità dell'errore di tipo I per rifiutare erroneamente la non-B a livello . Il rifiuto di non-B viene quindi interpretato come prova a favore di B perché controlliamo l'errore di tipo I, quindi è improbabile che non-B sia vero. Confuso ...? α

Prendi l'esempio del trattamento contro nessun trattamento in due gruppi di una popolazione. L'ipotesi interessante è che il trattamento ha un effetto, cioè c'è una differenza tra il gruppo trattato e il gruppo non trattato a causa del trattamento. L'ipotesi nulla è che non vi siano differenze e controlliamo la probabilità di respingere erroneamente questa ipotesi. Pertanto controlliamo la probabilità di concludere erroneamente che esiste un effetto terapeutico quando non vi è alcun effetto terapeutico. L'errore di tipo II è la probabilità di accettare erroneamente il valore nullo quando si verifica un effetto terapeutico.

La formulazione sopra è basata sul framework Neyman-Pearson per i test statistici, in cui i test statistici sono visti come un problema decisionale tra i casi, il null e l'alternativa. Il livello è la frazione di volte in cui commettiamo un errore di tipo I se ripetiamo (indipendentemente) il test. In questo quadro non esiste davvero alcuna distinzione formale tra il nullo e l'alternativa. Se scambiamo il nullo e l'alternativa, scambiamo la probabilità di errori di tipo I e di tipo II. Tuttavia, non abbiamo controllato la probabilità di errore di tipo II sopra (dipende da quanto è grande l'effetto del trattamento) e, a causa di questa asimmetria, potremmo preferire dire che non riusciamo a rifiutareαl'ipotesi nulla (invece che accettiamo l'ipotesi nulla). Quindi dovremmo stare attenti a concludere che l'ipotesi nulla è vera solo perché non possiamo rifiutarla.

In un quadro di test sulla significatività dei pescatori esiste davvero solo un'ipotesi nulla e si calcola, sotto il valore null, un valore per i dati osservati. Valori p più piccoli sono interpretati come prove più forti contro il nulla. Qui l'ipotesi nulla è sicuramente non-B (nessun effetto del trattamento) e il valore p viene interpretato come la quantità di prove contro il nulla. Con un piccolo valore p possiamo rifiutare con sicurezza il valore nullo, che non esiste alcun effetto terapeutico e concludere che esiste un effetto terapeutico. In questo quadro possiamo solo rifiutare o non rifiutare (mai accettare) il null, e si tratta solo di falsificare il null. Si noti che il pppppp-valore non deve essere giustificato da un numero (immaginario) ripetuto di decisioni.

Nessuno dei due framework è privo di problemi e la terminologia è spesso confusa. Posso consigliare il libro Prove statistiche: un paradigma di verosimiglianza di Richard M. Royall per un chiaro trattamento dei diversi concetti.


5

La risposta "frequentista" è quella di inventare un'ipotesi nulla della forma "non B" e quindi discutere contro "non B", come nella risposta di Steffen. Questo è l'equivalente logico di fare l'argomento "Ti sbagli, quindi devo avere ragione". Questo è il tipo di ragionamento dell'uso del politico (vale a dire che l'altra parte è cattiva, quindi siamo buoni). È abbastanza difficile trattare con più di 1 alternativa sotto questo tipo di ragionamento. Questo perché l'argomento "hai torto, quindi ho ragione" ha senso solo quando non è possibile che entrambi abbiano torto, il che può certamente accadere quando esiste più di un'ipotesi alternativa.

La risposta "bayesiana" è semplicemente calcolare la probabilità dell'ipotesi che sei interessato a testare, subordinatamente a qualsiasi prova tu abbia. Sempre questo contiene informazioni preliminari, che sono semplicemente le ipotesi che hai fatto per rendere il tuo problema ben posto (tutte le procedure statistiche si basano su informazioni precedenti, quelle bayesiane le rendono semplicemente più esplicite). Di solito è anche costituito da alcuni dati, e noi abbiamo il teorema di bayes

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

H0H0è l '"alternativa". Sono solo le connotazioni implicite dalle parole "null" e "alternative" che le fanno sembrare diverse. Puoi mostrare l'equivalenza nel caso del "Neyman Pearson Lemma" quando ci sono due ipotesi, poiché questo è semplicemente il rapporto di verosimiglianza, che viene dato immediatamente prendendo le probabilità del teorema di bayes sopra:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

H0Λ>Λ~Λ~H1L2L1L1L2

Λ1<Λ~1


3
Quel primo paragrafo è una parodia dell'approccio classico alla verifica delle ipotesi.
whuber

Il test di ipotesi non è sempre una questione di prendere una decisione. È spesso formulato come tale, ma nella scienza la domanda potrebbe essere quella di documentare che il nulla è falso e in che misura. Vedo la parola giocare come un promemoria di questo obiettivo. Da questo punto di vista, non riuscire a rifiutare non è una decisione da accettare ma una mancanza di prove nei dati da rifiutare.
NRH,

@NRH - Sono d'accordo, ma non è sempre questo l'obiettivo. Se vuoi testare una nuova teoria, vuoi sapere quanto è probabile che sia vera, tanto quanto vuoi sapere quanto è probabile che sia falsa. E sebbene un test di ipotesi non porti sempre direttamente a una decisione, sembra una perdita di tempo preoccuparsi di testarlo se alla fine non porterà a una decisione. In effetti stai già formulando una decisione nel tuo commento: "agisci come se il null fosse falso". C'è solo una alternativa a questo: "agisci come se il null fosse vero". Se esiste più di un'alternativa, allora l'ipotesi ...
Probislogic

(seguito) .. il test non è stato ben definito ed è "matematicamente mal posto" per così dire. Potrebbe esserci una grande incertezza su questa decisione, ma non ci sono altre alternative, il nulla non può essere vero e non falso allo stesso tempo, a meno che tu non abbia un problema mal posto / ambiguo. Ma in questo caso il test delle ipotesi è inutile: non ci può essere una conclusione corretta.
Probislogic,

(continuando il rant) - e se l'obiettivo è semplicemente quantificare le prove contro il nulla, non è necessario un test di ipotesi. Ecco a cosa serve un valore p: non è necessario accettare o rifiutare, è sufficiente segnalarne il valore.
Probislogic,

1

L'ipotesi nulla dovrebbe generalmente supporre che le differenze in una variabile di risposta siano dovute al solo errore.

Ad esempio, se si desidera verificare l'effetto di alcuni fattori Asulla risposta x, il valore null sarebbe:H0= Non vi è alcun effetto Asulla risposta x.

Non riuscire a respingere questa ipotesi nulla sarebbe interpretato come:

1) eventuali differenze xsono dovute al solo errore e non Aoppure,

2) che i dati non sono adeguati per rilevare una differenza anche se ne esiste una (vedere l'errore di tipo 2 di seguito).

Rifiutare questa ipotesi nulla sarebbe interpretata come l'ipotesi alternativa: Hun'= C'è un effetto Asulla risposta x, è vero.

Gli errori di tipo 1 e di tipo 2 sono correlati all'uso dell'ipotesi nulla, ma in realtà non alla sua designazione. L'errore di tipo 1 si verifica quando si rifiutaH0anche se è vero - che è, si concludono in modo non corretto un effetto di Asu xquando uno non esisteva. L'errore di tipo 2 si verifica quando non si riesce a rifiutareH0anche se è falso - cioè, si conclude erroneamente alcun effetto di Aon xanche se ne esiste uno.


1
Il terzo paragrafo sembra implicare che non riuscire a rifiutare il null significa che il null è vero, ma chiaramente questo è sbagliato: l'alternativa potrebbe essere vera (e in genere lo è), ma non differisce sufficientemente dal null per essere rilevata con i dati dati.
whuber

@whuber - buon punto, modificherò la risposta per riflettere questo
DQdlM
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.