Esiste un test statistico per confrontare due campioni di dimensioni 1 e 3?


19

Per un progetto di ecologia, il mio gruppo di laboratorio ha aggiunto aceto a 4 vasche contenenti uguali volumi di acqua di stagno, 1 controllo senza elodea (una pianta acquatica) e 3 trattamenti con la stessa quantità di elodea in ciascuno. Lo scopo di aggiungere l'aceto era di ridurre il pH. L'ipotesi era che i serbatoi con elodea sarebbero tornati al loro normale pH più velocemente. Questo è stato davvero il caso. Abbiamo misurato il pH di ogni serbatoio ogni giorno per circa due settimane. Tutti i serbatoi alla fine sono tornati al loro pH naturale, ma il tempo necessario è stato molto più breve per i serbatoi con elodea.

Quando abbiamo detto al nostro professore del nostro disegno sperimentale, ha detto che non esiste alcun test statistico che può essere eseguito sui dati per confrontare il controllo con il trattamento. Questo perché non c'era replica per il controllo (abbiamo usato solo un serbatoio di controllo) non possiamo calcolare la varianza e quindi non possiamo confrontare i mezzi di campionamento del controllo e del trattamento. Quindi la mia domanda è: è vero? Capisco sicuramente cosa intende. Ad esempio, se hai preso l'altezza di un uomo e una donna, non puoi trarre conclusioni sulle loro rispettive popolazioni. Ma abbiamo fatto 3 trattamenti e la varianza era piccola. Sembra ragionevole supporre che la varianza sarebbe simile nel controllo?

Aggiornare:

Grazie per l'eccellente risposta. Abbiamo preso più acqua ed elodea dalla zona umida e abbiamo deciso di ripetere l'esperimento con vasche più piccole, ma questa volta con 5 controlli e 5 trattamenti. Avremmo combinato questo con i nostri dati originali ma il pH iniziale dei serbatoi era abbastanza diverso da non sembrare valido considerare che il nuovo esperimento fosse campionato dalla stessa popolazione dell'esperimento originale.

Abbiamo preso in considerazione l'aggiunta di diverse quantità di elodea e il tentativo di correlare la velocità di correzione del pH (misurata come tempo trascorso fino a quando il pH è tornato al suo valore originale) con la quantità di elodea, ma abbiamo deciso che non era necessario. Il nostro obiettivo è solo quello di mostrare che l'elodea fa una differenza positiva, non di costruire un qualche tipo di modello predittivo per sapere esattamente come il pH risponde alle diverse quantità di elodea. Sarebbe interessante determinare la quantità ottimale di elodea, ma probabilmente è solo la quantità massima che può sopravvivere. Cercare di adattare una curva di regressione ai dati non sarebbe particolarmente illuminante a causa delle varie complicate modifiche che si verificano nella comunità quando si aggiunge una grande quantità. L'elodea muore, si decompone, i nuovi organismi iniziano a dominare e così via.


4
Hai aggiunto la stessa quantità di Elodea a ciascuna delle 3 vasche di "trattamento"?
gung - Ripristina Monica

2
Sì, abbiamo aggiunto la stessa quantità di Elodea a ciascun trattamento.
Simon Hunt,

Risposte:


21

Nota la domanda di Gung; importa. Presumo che il trattamento fosse lo stesso per ogni vasca del gruppo di trattamento.

Se puoi sostenere che la varianza sarebbe uguale per i due gruppi (che in genere dovresti assumere per un test t a due campioni), puoi fare un test. Non puoi controllare quell'ipotesi, non importa quanto gravemente possa essere violata.

Le preoccupazioni espresse in questa risposta a una domanda correlata sono ancora più rilevanti per la tua situazione, ma c'è meno che puoi fare al riguardo.

[Chiedete che sia ragionevole supporre che le varianze siano uguali. Non possiamo rispondere che per te, è qualcosa che dovresti convincere gli esperti in materia (ad esempio gli ecologisti) che era un presupposto ragionevole. Esistono altri studi in cui tali livelli sono stati misurati sia sotto il trattamento che sotto il controllo? Altri in cui sono stati fatti test simili (test t o anova in particolare - Scommetto che puoi trovare un precedente migliore) o ipotesi simili fatte? Qualche forma di ragionamento generale che puoi vedere per applicare?]

X¯y¯σ2X¯-y¯μX-μyσ2(1/nX+1/ny)n

ny

(X¯-y¯)SX1/nX+1

SXtnX-1

σSXSpny

Modificare:

Ecco una curva di potenza simulata per questo test. La dimensione del campione sul null era 10000, negli altri punti era 1000. Come vedi, il tasso di rifiuto sul null è 0,05 e la curva di potenza, mentre richiede una grande differenza nella popolazione significa avere una potenza decente, ha il forma giusta. Cioè, questo test fa quello che dovrebbe.

curva di potenza

(Fine modifica)

Con dimensioni del campione così ridotte, tuttavia, ciò sarà in qualche modo sensibile alle ipotesi distributive.

Se sei pronto a fare ipotesi diverse o vuoi testare l'uguaglianza di un'altra quantità di popolazione, alcuni test potrebbero essere ancora possibili.

Quindi non tutto è perduto ... ma dove possibile, è generalmente meglio avere almeno qualche replica in entrambi i gruppi.


1
Nota che dovrai seguire le formule @Glen_b delineate. Sia Excel che Minitab non calcoleranno questo.
Ciclista il

10
(+1) Un approccio equivalente (usando la stessa formula) - e quindi più munizioni per giustificare questa risposta - è che puoi calcolare un intervallo di predizione per un valore futuro dal gruppo di trattamento. Se il valore di controllo non rientra in tale intervallo di previsione, si ha una prova significativa di una differenza tra i due gruppi. La differenza potrebbe essere una combinazione di una differenza nella media o una differenza nelle varianze, ma c'è (probabilmente) una differenza.
whuber

3
σ(X¯-12)SX1/nXt

2
@Glen_b: non sono sicuro che questo sia cambiato lo scorso novembre, ma R 3.0 eseguirà un test t raggruppato quando una delle dimensioni del campione è una e fornisce la stessa risposta di un anova.
Aaron - Ripristina Monica il

2
Per chiunque voglia provarlo in R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - sembra che funzioni sia in R2.15.2 che in R3.0.0 (le uniche due versioni che ho a portata di mano).
Glen_b -Restate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.