@jbowman ti ha dato una buona opzione. Ho pensato di poter fornire alcune informazioni riguardanti le vostre domande esplicite sull'opportunità del test -test rispetto al test . χ 2zχ2
z -test:
Vi sono due dubbi sull'opportunità di utilizzare -test, sia per quanto riguarda la correttezza della distribuzione del campionamento ipotizzato. Innanzitutto, -test utilizza la distribuzione normale anziché la distribuzione , il che implica che le deviazioni standard sono note senza errori di campionamento. In secondo luogo, la distribuzione del campionamento è continua, ma i dati sono discreti; poiché sono possibili solo determinate combinazioni di dati, sono possibili solo determinati valori statistici di prova realizzati che potrebbero non corrispondere alla distribuzione teorica del campionamento. (Discuto questo problema nel contesto di altri test qui: confronto e contrasto, valori p, livelli di significatività ed errore di tipo I. ) z tzzt
Consideriamo la prima preoccupazione in un contesto diverso. Se hai due gruppi con dati normalmente distribuiti e vuoi vedere se le medie sono equivalenti, devi calcolare sia le medie sia le deviazioni standard. Ora sappiamo che i mezzi sono soggetti a errori di campionamento, ecco perché dobbiamo fare il test piuttosto che dire semplicemente che questi due mezzi di campionamento non sono identici. Tuttavia, anche le nostre stime delle deviazioni standard devono essere soggette a errori di campionamento e dobbiamo tenerne conto in qualche modo. Quando lo facciamo, si scopre che la statistica del test (una sorta di differenza media in scala) è distribuita come . Se invece usassimo la distribuzione normale (cioèz ztz-test), significherebbe che stiamo assumendo che le nostre stime delle deviazioni standard siano senza errori - perfette. Allora perché lo -test potrebbe essere usato nel tuo caso? Il motivo è che i tuoi dati sono binomiali (ovvero, il numero di "successi" su un totale noto di "prove"), anziché normali. Nella distribuzione binomiale , la deviazione standard è una funzione della media, quindi una volta stimata la media non c'è più incertezza di cui preoccuparsi. Pertanto, la distribuzione normale può essere utilizzata come modello della distribuzione campionaria della statistica test. z
Sebbene l'utilizzo della distribuzione normale per comprendere il comportamento a lungo termine della statistica del test sia tecnicamente corretto, emerge un altro problema. Il problema è che la distribuzione normale è continua, ma poiché i tuoi dati sono discreti, non tutti i valori nella distribuzione teorica possono essere trovati nel tuo set di dati. (Anche in questo caso, discuto questo problema in considerevolmente più in dettaglio nella risposta precedente legato.) Fortunatamente, la corrispondenza tra i possibili esiti dei vostri dati e la distribuzione campionaria normale teorico migliora la tua più grande . Nel tuo caso, indipendentemente dalle reali probabilità sottostanti, potresti avere tutti i successi o meno di nessuno in ciascun gruppo. Ciò significa che il numero di combinazioni possibili è91 × 91 = 1 ,NN = 180 z91×91=1,729, che è molte possibilità. Con un piccolo set di dati, puoi davvero imbatterti in alcuni dei tipi di problemi che discuto nella mia risposta collegata, ma con , non devi preoccuparti troppo. Credo che -test sia stata una scelta valida per i ricercatori. N=180z
χ2 -test:
Ma per quanto riguarda il test ? Penso che sia anche una scelta valida, ma non sarebbe la mia prima scelta. (Consentitemi di notare che la seconda preoccupazione discussa sopra - una discrepanza tra dati discreti e una distribuzione di riferimento continua - si applica tanto al test che al test , quindi c'è nessun vantaggio qui.) Il problema conχ 2 z χ 2 χ 2 z zχ2χ2zχ2-test è che non presuppone che ci sia qualcosa di speciale nei totali di colonna rispetto ai totali di riga; entrambi sono trattati come se potessero essere stati altri possibili valori. Tuttavia, ciò non riflette accuratamente l'impostazione sperimentale. C'erano 180 persone e 90 erano assegnate a ciascun gruppo. L'unica cosa che potrebbe davvero variare tra ripetuti studi identici è il numero di persone che hanno preso il raffreddore in ciascun gruppo. Il test tratta erroneamente sia il numero di raffreddori che il numero di persone in ciascun gruppo come se potessero variare, ma il test fa il presupposto giusto. Ecco perché lo -test ha più potere qui. χ2zz
Per quello che vale, il test di permutazione suggerito da @jbowman rende giusto questo aspetto del tuo progetto e non soffre del problema di discrepanza discreta-continua. Pertanto, è l'opzione migliore. Ma ho pensato che ti sarebbe piaciuto sapere qualcosa in più su come i test - e si confrontano nella tua situazione. χ 2zχ2