Dimensione minima del campione per t-test non accoppiato


16

Esiste una "regola" per determinare la dimensione minima del campione richiesta affinché un test t sia valido?

Ad esempio, è necessario eseguire un confronto tra le medie di 2 popolazioni. Ci sono 7 punti dati da una popolazione e solo 2 punti dati dall'altra. Sfortunatamente, l'esperimento è molto costoso e richiede tempo e non è possibile ottenere più dati.

È possibile utilizzare un test t? Perché o perché no? Fornisci i dettagli (le variazioni e le distribuzioni della popolazione non sono note). Se non è possibile utilizzare un test t, è possibile utilizzare un test non parametrico (Mann Whitney)? Perché o perché no?


2
Questa domanda riguarda materiale simile e sarà di interesse per gli spettatori di questa pagina: è necessaria una dimensione minima del campione affinché il test t sia valido? .
gung - Ripristina Monica

Vedi anche questa domanda in cui viene discusso il test con campioni di dimensioni anche inferiori.
Glen_b

Risposte:


8

Mi consiglia di utilizzare il non parametrico di Mann-Whitney U Test piuttosto che un spaiato t -test qui.

Non esiste una dimensione minima assoluta del campione per il test t , ma man mano che le dimensioni del campione si riducono, il test diventa più sensibile al presupposto che entrambi i campioni siano estratti da popolazioni con una distribuzione normale. Con campioni così piccoli, specialmente con un campione di solo due, dovresti essere molto sicuro che le distribuzioni della popolazione fossero normali - e che si debbano basare su conoscenze esterne, dato che tali piccoli campioni forniscono pochissime informazioni la normalità o meno delle loro distribuzioni. Ma tu dici che "le varianze e le distribuzioni della popolazione non sono note" (il mio corsivo).

Il test U di Mann-Whitney non richiede alcuna ipotesi sulla forma parametrica delle distribuzioni, richiedendo solo l'assunto che le distribuzioni dei due gruppi siano le stesse sotto l'ipotesi nulla.


6
Non è una buona raccomandazione per campioni di dimensioni estremamente ridotte. Con 7 e 2 campioni, il test U fallirà, non importa quanto grande sia la differenza tra la media dei gruppi. Guarda la mia risposta per un esempio.
AlefSin

2
Vorrei secondo ciò che dice @AlefSin. Se è importante per te trarre conclusioni valide (e non solo ottenere un valore p), allora le ipotesi più accettabili che puoi rendere migliori. Se esistono informazioni di base ragionevoli, è possibile aggiungere ulteriori ipotesi se si eseguisse l'analisi in un quadro bayesiano.
Rasmus Bååth,

2
Un problema è che con campioni così piccoli, Wilcoxon-Mann-Whitney non può raggiungere livelli di significatività tipici. Con dimensioni del campione di 7 e 2 non otterrai mai un risultato significativo al livello del 5%, non importa quanto sia evidente la differenza. Considera (1.018,1.031,1.027,1.020,1,021,1,019,1,024) vs (713,2, 714,5) - non significativo al livello del 5%!
Glen_b

3
n1=7n2=2

6

(dichiarazione di non responsabilità: non posso scrivere bene oggi: la mia mano destra è fratturata!)

Contrariamente al consiglio di usare un test non parametrico in altre risposte, si dovrebbe considerare che per campioni di dimensioni estremamente ridotte questi metodi non sono molto utili. È facile capire perché: negli studi con dimensioni estremamente ridotte, non è possibile stabilire alcuna differenza tra i gruppi se non si osserva una dimensione di grande effetto se osservata. I metodi non parametrici, tuttavia, non si preoccupano dell'entità della differenza tra i gruppi. Pertanto, anche se la differenza tra i due gruppi è enorme, con una piccola dimensione del campione un test non parametrico fallirà sempre nel rifiutare l'ipotesi nulla.

Considera questo esempio: due gruppi, distribuzione normale, stessa varianza. Gruppo 1: media 1,0, 7 campioni. Gruppo 2: media 5, 2 campioni. C'è una grande differenza tra le medie.

wilcox.test(rnorm(7, 1), rnorm(2, 5))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 5)
W = 0, p-value = 0.05556

Il valore p calcolato è 0,05556 che non rifiuta l'ipotesi nulla (a 0,05). Ora, anche se aumenti la distanza tra le due medie di un fattore 10, otterrai lo stesso valore p:

wilcox.test(rnorm(7, 1), rnorm(2, 50))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 50)
W = 0, p-value = 0.05556

Ora vi invito a ripetere la stessa simulazione con t-test e osservare i valori di p nel caso di differenze grandi (media 5 contro 1) ed enormi (media 50 contro 1).


5

Non esiste una dimensione minima del campione per un test t; il t-test è stato, infatti, progettato per piccoli campioni. Ai vecchi tempi, quando venivano stampate le tabelle, venivano visualizzate tabelle di test t per campioni molto piccoli (misurati da df).

Naturalmente, come con altri test, se c'è un piccolo campione solo un effetto abbastanza grande sarà statisticamente significativo.


Ma sarà anche il contrario? Vale a dire, i valori anomali che sono stati campionati potrebbero portare a respingere erroneamente l'ipotesi nulla? Oppure la bassa potenza per rilevare le differenze è un problema maggiore? In questa particolare situazione vedo una differenza significativa tra i mezzi ma non so quanto "fidarmi" di esso.
Johnny perplesso il

2
Con n = 2 sei decisamente vulnerabile all'influenza dei valori anomali - valori anomali nella popolazione; come può un campione di 2 avere un valore anomalo all'interno del campione? :-) Non proverei nessuna statistica inferenziale in questa situazione. Le prospettive sono povere per arrivare alla "verità" e ti lascerai spalancato alle critiche.
rolando2,

2
Il motivo per cui l'intervallo di confidenza sarà ampio è proprio perché potresti ottenere un valore anomalo. Ma il test t presuppone ancora che i campioni provengano da una popolazione normale.
Peter Flom - Ripristina Monica

2

Suppongo che tu intenda avere 7 punti dati da un gruppo e 2 punti dati da un secondo gruppo, entrambi i quali sono sottoinsiemi di popolazioni (ad esempio sottoinsieme di maschi e sottoinsieme di femmine).

La matematica per il test t può essere ottenuta da questa pagina di Wikipedia . Assumeremo un test t a due campioni indipendente, con dimensioni dei campioni disuguali (7 contro 2) e varianze disuguali, quindi circa a metà pagina. Puoi vedere che il calcolo si basa su medie e deviazioni standard. Con solo 7 soggetti in un gruppo e 2 soggetti in un altro, non puoi presumere di avere buone stime per la media o la deviazione standard. Per il gruppo con 2 soggetti, la media è semplicemente il valore che si trova esattamente nel mezzo dei due punti dati, quindi non è ben stimato. Per il gruppo con 7 soggetti, la dimensione del campione influenza fortemente le varianze (e quindi le deviazioni standard, che sono la radice quadrata della varianza) perché i valori estremi esercitano un effetto molto più forte quando si ha un campione più piccolo.

Ad esempio, se guardi l' esempio di base sulla pagina di Wikipedia per la deviazione standard vedrai che la deviazione standard è 2 e la varianza (quadrata della deviazione standard) è quindi 4. Ma se avessimo solo i primi due punti dati (il 9 e l'1), la varianza sarebbe 10/2 = 5 e la deviazione standard sarebbe 2,2 e se avessimo solo gli ultimi due valori (il 4 e il 16), la varianza sarebbe 20/2 = 10 e la deviazione standard sarebbe 3.2. Stiamo ancora usando gli stessi valori, solo meno di loro, e possiamo vedere l'effetto sulle nostre stime.

Questo è il problema con l'utilizzo di statistiche inferenziali con campioni di piccole dimensioni, i risultati saranno particolarmente influenzati dal campionamento.

Aggiornamento: c'è qualche motivo per cui non puoi semplicemente riportare i risultati per argomento e indicare che si tratta di lavoro esplorativo? Con solo due casi, i dati sono molto simili a quelli di un caso di studio, e questi sono entrambi (1) importanti da scrivere e (2) pratica accettata.


Grazie Michelle. Questo è interessante e utile da sapere. Tuttavia, cosa consiglieresti da un punto di vista pratico? Data questa situazione, qual è il modo migliore per procedere? Grazie!
Johnny perplesso il

Ciao Johnny perplesso. Senza ulteriori informazioni sulla tua situazione esatta non mi sento in grado di fornire ulteriori indicazioni.
Michelle,

Che tipo di informazioni sono necessarie?
Johnny perplesso il

1
Ciao di nuovo, maggiori informazioni sulla progettazione del tuo studio, come ad esempio quali sono i tuoi dati, come li hai raccolti, quali sono i tuoi gruppi, come sono state selezionate le osservazioni. Tutto quello che so è che hai fatto un esperimento con 9 osservazioni (persone? Ratti? Neuroni? Blocchi di formaggio? Frequenze di radiazione?) Che provengono da due gruppi.
Michelle,

Diciamo che il flusso medio di sangue alla sostanza bianca nel cervello è stato misurato nell'uomo usando la risonanza magnetica. I gruppi sono controlli (7 persone) e pazienti abbinati età / sesso con un particolare disturbo (2 persone).
Johnny perplesso il

1

Interessante articolo correlato: "Utilizzo del test t di Student con dimensioni di samlpe estremamente basse" JCF de Winter (in valutazione pratica, ricerca e valutazione) http://goo.gl/ZAUmGW


0

Consiglierei di confrontare le conclusioni ottenute con entrambi, il test t e il test Mann-Whitney, e dare un'occhiata anche ai grafici a scatole e alla probabilità del profilo della media di ogni popolazione.


Ciao @Demian, non sono sicuro che anche un boxplot sarà utile quando un gruppo ha una dimensione del campione di 2. Altrimenti, sì, penso che i boxplot in particolare siano molto utili nella visualizzazione di dati continui tra i gruppi.
Michelle,

0

Codice Stata 13 / SE per un test bootstrapPoiché un test eseguito su piccoli campioni probabilmente non soddisfa i requisiti di test (principalmente, la normalità delle popolazioni da cui i due campioni sono stati ricavati dalle api), consiglierei di eseguire un test bootstrap (con varianze ineguali), seguendo Efron B, Tibshirani Rj. Un'introduzione al Bootstrap. Boca Raton, FL: Chapman & Hall / CRC, 1993: 220-224. Il codice per un test di bootstrap sui dati forniti da Johnny Puzzled in Stata 13 / SE è riportato nell'immagine sopra.


La tua risposta ha seri problemi di formattazione, ti dispiacerebbe modificarla?
ameba dice di reintegrare Monica il

Ho provato a risolvere i problemi di formattazione nella versione rivista della risposta. Grazie ad ameba per averlo segnalato.
Carlo Lazzaro,

0

Con una dimensione del campione di 2, la cosa migliore da fare potrebbe essere quella di guardare i singoli numeri stessi e nemmeno preoccuparsi dell'analisi statistica.


1
Al momento questo sembra più un commento. Mentre questo è un buon punto, per una ragionevole risposta al problema originale, ci si potrebbe aspettare qualche discussione sul problema stesso, anche se alla fine si conclude che ha più senso fare qualcos'altro.
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.