Differenza tra test a una coda e due code?


13

Mentre studiavo per il mio corso di statistica, stavo cercando di capire la differenza tra test di ipotesi a una coda e due code. In particolare, perché il test a una coda rifiuta il null mentre quello a due code no?

Un esempio:

la differenza tra test di ipotesi a una coda e due code


Tieni presente che stai rifiutando solo a un livello di significatività specificato. Puoi ancora respingere entrambe le ipotesi portando il livello di significatività al 10%. falliresti anche nel rifiutare entrambi se abbassassi il livello di significatività all'1%.
Probislogic

Risposte:


11

Un test a due code verifica la differenza in entrambe le direzioni. Pertanto il valore P sarebbe l'area sotto la distribuzione t a destra di t = 1,92 PIÙ l'area sotto la distribuzione a sinistra di t = -1,92. È un'area doppia rispetto al test con una coda e quindi il valore P è il doppio.

Se si utilizza un test a una coda, si ottiene potenza, ma al costo potenziale di dover ignorare una differenza che è nella direzione opposta a quella ipotizzata prima che i dati fossero ottenuti. Se hai ottenuto i dati prima di formalizzare e registrare l'ipotesi, dovresti davvero utilizzare un test a due code. Allo stesso modo, se ti interessa un effetto in entrambe le direzioni, usi un test a due code. In effetti, potresti voler utilizzare un test a due code come approccio predefinito e utilizzare solo un test a una coda nel caso insolito in cui un effetto può esistere solo in una direzione.


Grazie per il tuo commento, Michael. Ecco cosa non capisco: come può l'area sotto la curva essere due volte più grande per il test a due code? P non dovrebbe essere lo stesso in entrambi i casi, poiché alpha = 0,05?
Lu Ci

alpha, nella tua domanda, è solo il tuo cutoff per prendere una decisione su cosa p-sign (respingere null o no). Quindi, non influenza quale sia il valore di p.
Giovanni

Un po 'pignolo ma l'idea che è necessario scegliere l'ipotesi prima di vedere i dati non è necessaria. Puoi fare due test su un lato. Rifiuterai sempre la direzione non favorita dai dati. Quindi ha senso andare con il test unilaterale che è favorito dai dati.
Probislogic

1
@probabilityislogic - Sono completamente d'accordo, tranne quando si desidera che il valore alfa rifletta il tasso di errore falso positivo a lungo termine (ovvero si desidera utilizzare l'approccio Neyman-Pearson). Se usi un test unilaterale e decidi la direzione del cambiamento da testare sulla base dell'effetto osservato, otterrai esattamente il doppio di risultati falsi positivi rispetto al livello alfa.
Michael Lew,

È solo il tasso di errore a lungo termine per qualcuno che continua a ignorare i dati precedenti. Questo non è un buon modo per ottenere buone prestazioni a lungo termine. il tasso di errore dato dalla significatività è su tutti i set di dati che avremmo potuto osservare una volta .
Probislogic

5

L'area sotto la curva non è due volte più grande per un test a due code: per un test a due code con p = 0,05 critico, si sta verificando la frequenza con cui i dati osservati potrebbero essere estratti dal 2,5% inferiore o superiore di una distribuzione nulla ( 0,05 in totale). Con un test a 1 coda, stai testando la frequenza con cui i dati verrebbero dall'estrema coda del 5% di una coda (pre-specificata).

In parte la risposta alla tua domanda è di tipo pratico: la maggior parte dei ricercatori considera improbabile che si verifichino repliche di esperimenti che riportano test a 1 coda (ovvero, presumono che il ricercatore abbia scelto questo per rendere le proprie statistiche "significative").

Vi sono tuttavia casi d'uso validi. Se sai che qualsiasi risultato nella direzione inversa è impossibile secondo la teoria in fase di test, allora, come notato in un commento precedente, puoi specificarlo in anticipo e condurre un test a 1 coda. Molte persone, ancora una volta, lo vedrebbero ancora con circospezione.


0

S(D)RR

S(D)=|t||t|>t0 dove t0 è scelto per raggiungere il significato αche è il 5% nel tuo caso. per il test unilaterale la statistica del test èS(D)=t e la regione di rifiuto è t>t1 per opportunamente scelto t1. ora avremo semprePr(|t|>t0|H0)Pr(t>t0|H0). quindi per ottenere lo stesso significato dobbiamo averet0t1.

Questo porta alla domanda: perché usare diverse statistiche di test? Il motivo è che le alternative sono diverse e quindi la potenza di ciascuna statistica test è diversa. In particolare, la potenza di ciascun test viene ridotta (purché utilizziamo lo stesso significato) se utilizziamo la statistica del test e la regione di rifiuto dall'altro test.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.