Perché è necessario un test t dato che abbiamo il test z?


9

Qualcuno può dare una spiegazione del perché il test t "succede"? Mi è stato insegnato ad usare il test t quando non conosci la deviazione standard della popolazione (cioè conosci solo la deviazione standard del tuo campione), ma non sono sicuro del perché ciò lo renderebbe diverso da un test z .


Ho aggiornato il tuo titolo per ottenere la domanda che penso tu stia ponendo; sentiti libero di modificare se ho frainteso
Jeromy Anglim,

Risposte:


3

Non credo di aver capito completamente la tua domanda. Stai chiedendo perché dovresti usare un test t?

Se capisci perché dovresti usare un test z, dovresti avere una buona idea del perché dovresti usare un test t. Per campioni di grandi dimensioni, un test z e un test t dovrebbero fornire risultati simili o identici. Ma mentre un test z assumerà una distribuzione normale, un test t terrà conto dell'incertezza nella distribuzione del campione a campioni di dimensioni inferiori.


3
Hmm anche il test t assume una distribuzione normale. Forse quello che intendevi dire è che abbiamo bisogno di meno informazioni su quella distribuzione.
JohnK,

@JohnK Non penso che abbia senso dire che un test presuppone una distribuzione in primo luogo, ma penso che Benjamin abbia inteso che il punteggio t / statistica assume la distribuzione T e non la distribuzione Z.
Datoraki,

3

Lo z-test stesso è in realtà un test del rapporto di verosimiglianza tra la probabilità che assuma l'ipotesi nulla e la probabilità che assuma l'ipotesi alternativa. Assumendo le normali distribuzioni sottostanti con varianze note e testando solo i mezzi, l'algebra si semplifica al test z che conosciamo e amiamo (DeGroot 1986, pp. 442-447).

Utilizzando la stessa procedura di massima verosimiglianza, ma trattando la varianza come sconosciuta, si crea una coppia diversa di verosimiglianze e il loro rapporto, e lasciando che l'algebra si semplifichi, si ottiene la statistica: (DeGroot 1986, pagg. 485–489). Anche la distribuzione del test in questione cambia, poiché il numeratore della statistica sopra è normalmente distribuito, , e il denominatore è distribuito come radice quadrata delle normali quadrate, , che è la radice quadrata di un variabile casuale chi-quadro. Gosset (Studente) ha dimostrato che se hai una variabile casuale: ˉXS2YN(0,1)

n(X¯nμ0)Sn2n1
X¯S2
YN(0,1)Zχn2XYZn
quindi X viene distribuito con la distribuzione t e n gradi di libertà.

Quindi, per dirlo senza rigore, il test t è il risultato naturale dello stesso processo di rapporto di probabilità che è dietro il test z quando la varianza dei dati è di per sé sconosciuta e viene stimata con la massima probabilità.


1
questo è stato molto illuminante. Avevo completamente dimenticato che il test t proviene dalla massima verosimiglianza
Moderat

1

La risposta non rigorosa è che si desidera utilizzare un test t quando si dispone di un piccolo numero di campioni a causa della possibilità che i campioni siano insolitamente vicini tra loro (rispetto alla varianza effettiva della popolazione). In tal caso, il denominatore nella formula per la statistica t sarà insolitamente piccolo, e quindi la statistica t stessa sarà insolitamente grande. Pertanto, è molto più probabile che si ottenga un valore elevato per la t-stat quando si dispone di un piccolo numero di campioni rispetto a quello che si otterrebbe per ottenere una z-stat relativamente grande, quindi è necessario un valore maggiore per rifiutare il valore nullo utilizzando il test t rispetto al test z allo stesso livello di significatività.


Trovo l'argomento accattivante ma, su riflessione, non convincente. Dopotutto, se per caso i campioni sono insolitamente distanti (il che dovrebbe accadere altrettanto facilmente quanto essere insolitamente vicini), allora la stessa logica porterebbe alla conclusione opposta.
whuber

0

Il fattore di differenziazione più importante è la dimensione del campione, come regola empirica: se è inferiore a , è necessario utilizzare un test t, altrimenti un test z.30n30

Una buona panoramica delle ipotesi e delle differenze sottostanti (e somiglianze) di entrambi i test è fornita qui:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.