Mentre studiavo per il mio corso di statistica, stavo cercando di capire la differenza tra test di ipotesi a una coda e due code. In particolare, perché il test a una coda rifiuta il null mentre quello a due code no?
Un esempio:
Mentre studiavo per il mio corso di statistica, stavo cercando di capire la differenza tra test di ipotesi a una coda e due code. In particolare, perché il test a una coda rifiuta il null mentre quello a due code no?
Un esempio:
Risposte:
Un test a due code verifica la differenza in entrambe le direzioni. Pertanto il valore P sarebbe l'area sotto la distribuzione t a destra di t = 1,92 PIÙ l'area sotto la distribuzione a sinistra di t = -1,92. È un'area doppia rispetto al test con una coda e quindi il valore P è il doppio.
Se si utilizza un test a una coda, si ottiene potenza, ma al costo potenziale di dover ignorare una differenza che è nella direzione opposta a quella ipotizzata prima che i dati fossero ottenuti. Se hai ottenuto i dati prima di formalizzare e registrare l'ipotesi, dovresti davvero utilizzare un test a due code. Allo stesso modo, se ti interessa un effetto in entrambe le direzioni, usi un test a due code. In effetti, potresti voler utilizzare un test a due code come approccio predefinito e utilizzare solo un test a una coda nel caso insolito in cui un effetto può esistere solo in una direzione.
L'area sotto la curva non è due volte più grande per un test a due code: per un test a due code con p = 0,05 critico, si sta verificando la frequenza con cui i dati osservati potrebbero essere estratti dal 2,5% inferiore o superiore di una distribuzione nulla ( 0,05 in totale). Con un test a 1 coda, stai testando la frequenza con cui i dati verrebbero dall'estrema coda del 5% di una coda (pre-specificata).
In parte la risposta alla tua domanda è di tipo pratico: la maggior parte dei ricercatori considera improbabile che si verifichino repliche di esperimenti che riportano test a 1 coda (ovvero, presumono che il ricercatore abbia scelto questo per rendere le proprie statistiche "significative").
Vi sono tuttavia casi d'uso validi. Se sai che qualsiasi risultato nella direzione inversa è impossibile secondo la teoria in fase di test, allora, come notato in un commento precedente, puoi specificarlo in anticipo e condurre un test a 1 coda. Molte persone, ancora una volta, lo vedrebbero ancora con circospezione.
dove è scelto per raggiungere il significato che è il 5% nel tuo caso. per il test unilaterale la statistica del test è e la regione di rifiuto è per opportunamente scelto . ora avremo sempre. quindi per ottenere lo stesso significato dobbiamo avere.
Questo porta alla domanda: perché usare diverse statistiche di test? Il motivo è che le alternative sono diverse e quindi la potenza di ciascuna statistica test è diversa. In particolare, la potenza di ciascun test viene ridotta (purché utilizziamo lo stesso significato) se utilizziamo la statistica del test e la regione di rifiuto dall'altro test.