T-test accoppiato contro non accoppiato


20

Supponiamo che io abbia 20 topi. Ho accoppiato i topi in qualche modo, in modo da ottenere 10 coppie. Ai fini di questa domanda, potrebbe essere un accoppiamento casuale, O potrebbe essere un accoppiamento sensato, come cercare di accoppiare topi della stessa cucciolata, dello stesso sesso, con peso simile, O potrebbe essere un accoppiamento deliberatamente stupido come cercando di accoppiare i topi con pesi il più possibile ineguagliabili. Quindi uso numeri casuali per assegnare un topo in ciascuna coppia al gruppo di controllo e l'altro topo al gruppo da trattare. Ora faccio l'esperimento, trattando solo i topi da trattare, ma per il resto non faccio alcuna attenzione alle disposizioni appena prese.

Quando si arriva ad analizzare i risultati, si potrebbe usare un test t accoppiato o un test t accoppiato. In che modo le eventuali risposte differiranno? (Sono sostanzialmente interessato alle differenze sistematiche di qualsiasi parametro statistico che deve essere stimato.)

Il motivo per cui lo chiedo è che un articolo con cui sono stato recentemente coinvolto è stato criticato da un biologo per l'utilizzo di un test t accoppiato piuttosto che di un test t spaiato. Naturalmente, nell'esperimento vero e proprio, la situazione non era così estrema come quella che ho disegnato e c'erano, secondo me, buone ragioni per l'accoppiamento. Ma il biologo non era d'accordo.

Mi sembra che non sia possibile migliorare in modo errato la significatività statistica (ridurre il valore p), nelle circostanze che ho tracciato, utilizzando un test t accoppiato, piuttosto che un test non accoppiato, anche se non è appropriato accoppiarlo. Potrebbe tuttavia peggiorare il significato statistico se i topi fossero mal accoppiati. È giusto?

Risposte:


23

Concordo con i punti sollevati sia da Frank che da Peter, ma penso che esista una formula semplice che affronti il ​​problema e che potrebbe valere la pena prendere in considerazione l'OP.

Siano e Y due variabili casuali la cui correlazione è sconosciuta.XY

Sia Z=XY

Qual è la varianza di ?Z

Ecco la formula semplice: Cosa succede se Cov ( X , Y ) > 0 (ovvero, X e Y sono correlati positivamente)?

Var(Z)=Var(X)+Var(Y)2Cov(X,Y).
Cov(X,Y)>0XY

Quindi Var(Z)<Var(X)+Var(Y). In questo caso, se l'associazione viene effettuata a causa di una correlazione positiva, ad esempio quando si ha a che fare con lo stesso soggetto, l'associazione prima e dopo l'intervento aiuta perché la differenza indipendente associata ha una varianza inferiore rispetto alla varianza ottenuta per il caso non accoppiato. Il metodo ha ridotto la varianza. Il test è più potente. Questo può essere drammaticamente mostrato con dati ciclici. Ho visto un esempio in un libro in cui volevano vedere se la temperatura a Washington DC è più alta che a New York City. Quindi hanno preso la temperatura media mensile in entrambe le città per circa 2 anni. Naturalmente c'è una grande differenza nel corso dell'anno a causa delle quattro stagioni. Questa variazione è troppo grande per un test t spaiato per rilevare una differenza. Tuttavia, l'abbinamento basato sullo stesso mese dello stesso anno elimina questo effetto stagionale e l'abbinamento test ha mostrato chiaramente che la temperatura media in DC tendeva ad essere più alta che a New York. X i (temperatura a New York nel mese A ) e Y i (temperatura a DC nel mese A ) sono positivamente correlati perché le stagioni sono le stesse a New York e DC e le città sono abbastanza vicine da sperimentare spesso gli stessi sistemi meteorologici che influire sulla temperatura. DC può essere un po 'più caldo perché è più a sud.tXiUNYioUN

Si noti che maggiore è la covarianza o la correlazione maggiore è la riduzione della varianza.

Supponiamo ora che sia negativo.Cov(X,Y)

Quindi . Ora l'abbinamento sarà peggio che non l'abbinamento perché la varianza è effettivamente aumentata!Var(Z)>Var(X)+Var(Y)

Quando e Y non sono correlati, probabilmente non importa quale metodo usi. Il caso di accoppiamento casuale di Peter è come questa situazione.XY


3
Michael, perché "<" e ">" hanno significati speciali sulle pagine Web, per evitare che ampie parti del tuo testo scompaiano semplicemente dalla vista, è essenziale che tu usi Markup X per loro nelle equazioni (i codici sono rispettivamente "\ lt" e "\ gt"). Ho contrassegnato le due equazioni che hanno causato questo problema per te. In futuro, leggi ciò che pubblichi immediatamente dopo averlo pubblicato per assicurarti che le persone vedano ciò che pensavi che avrebbero visto, quindi sentiti libero di segnalare il tuo messaggio per l'attenzione del moderatore se c'è qualche problema con il markup. TEX
whuber

@whuber Grazie. In genere controllo durante e dopo la pubblicazione perché trovo che sbaglio molto le equazioni, specialmente durante la sottoscrizione. Manca questo è insolito e probabilmente è accaduto perché era un post lungo e ho semplicemente trascurato di dedicarmi a qualcos'altro che volevo o dovevo fare. A volte una telefonata mi distrae e mi dimentico di controllare. Per quanto riguarda i simboli speciali che fanno sparire il testo in un post, l'ho osservato. Penso che una soluzione semplice sia assicurarsi di lasciare uno spazio dopo il simbolo. Penso che abbia funzionato per me in passato.
Michael R. Chernick,

XYVar(Z)=Var(X)+Var(Y)

@MichaelChernick Nel caso in cui Cov (X, Y) <0, ho una domanda: se il mio obiettivo è inferire E [X] -E [Y] dal mio esperimento, allora ANCHE PENSIERO ho condotto uno studio accoppiato, quando analizzare i miei dati, posso ancora FARE che il risultato del mio esperimento sia una realizzazione di un esperimento randomizzato NON APERTO. Posso farlo? Perché se hai davvero fatto un esperimento casuale spaiato, puoi letteralmente ottenere lo stesso risultato. Quindi posso semplicemente prendere la media di ciascun gruppo (ignorare le cose di associazione) e prendere la differenza della media dei due gruppi. Questo è uno stimatore imparziale di E [Z]. Per varianza del mio stimatore, uso solo ...
KevinKim

@MichaelChernick la varianza campione del gruppo X e del gruppo Y e
riassumili

7

Piuttosto che accoppiare è probabilmente meglio capire il modello di dati sottostante. Se l'associazione viene eseguita per gestire l'eterogeneità incontrollata, di solito è il caso (tranne che negli studi sui gemelli) che l'associazione controlla solo parzialmente questa fonte di variabilità e la regressione multipla farebbe meglio. Questo perché la corrispondenza su variabili continue comporta spesso una variabilità residua perché non è possibile eseguire la corrispondenza esatta su tali variabili.


2
Se dovessimo fare tutti regressione, perché i libri di Experimental Design, come il libro di David Cox, sottolineano l'importanza di associare o raggruppare esperimenti biologici? L'associazione evita il presupposto nascosto della dipendenza lineare comportato nella regressione. Ma forse ci sono altri motivi: qualcuno ??
David Epstein,

6

I due test (accoppiati e non accoppiati) pongono domande diverse in modo che possano ottenere risposte diverse. L'abbinamento corretto è quasi sempre più potente di quello non accoppiato - questo è davvero il punto di accoppiamento. Pertanto, poiché si afferma che l'associazione è corretta, è probabile che il valore p per il test associato sia inferiore rispetto agli stessi dati non accoppiati. Ovviamente potresti fare entrambe le cose e vedere di persona.

Pertanto, la risposta al tuo dilemma è sostanziale, non statistica. Il tuo abbinamento è giusto?

Potresti ottenere un risultato più significativo dall'associazione casuale che da un test non accoppiato? Vediamo:

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

Sì, puoi, anche se qui la differenza è molto piccola, l'abbinamento ha avuto un p inferiore. Ho eseguito quel codice più volte. Non sorprende che a volte una p sia più bassa, a volte l'altra, ma la differenza era piccola in tutti i casi. Tuttavia, sono sicuro che in alcune situazioni la differenza nei valori di p potrebbe essere grande.


Grazie per la risposta, ma la mia domanda ha chiesto differenze sistematiche . Ovviamente, a lungo termine di x e y, a volte x e y sembrano come se fossero molto ben accoppiati, e occasionalmente come se fossero stati deliberatamente accoppiati male. Sicuramente è una domanda statistica se, scegliendo casualmente xey, la distribuzione dei valori p sia la stessa nei due test. Suppongo che non dovrebbe essere troppo difficile per qualcuno che conosce più statistiche teoriche di me per calcolare effettivamente le due distribuzioni teoriche di valori p. La mia ipotesi è che siano uguali.
David Epstein,

Nel caso reale in cui sono stato coinvolto, il valore p per gli accoppiati era pari a circa 0,04 e per gli accoppiati a 0,001. Secondo il biologo critico, dovremmo citare .04. Secondo me, il miglioramento del valore p indica fortemente che la nostra associazione era valida. Sostengo che qui c'è una domanda obiettiva nelle statistiche, con una risposta obiettiva, e che non è solo una questione di buon giudizio biologico sulla validità del particolare accoppiamento --- quest'ultimo sembra essere l'opinione di Peter Flom e di il biologo critico.
David Epstein,

1
Penso che le statistiche raccontino la storia. Entrambi i risultati devono essere divulgati, ma fintanto che i dati sono corretti e la correlazione può essere spiegata, il test accoppiato è più preciso perché tiene conto della correlazione.
Michael R. Chernick,

5

Ora capisco molto meglio ciò che mi preoccupava dei test t accoppiati rispetto a quelli non accoppiati e dei valori p associati. Scoprirlo è stato un viaggio interessante e ci sono state molte sorprese lungo il cammino. Una sorpresa è derivata da un'indagine sul contributo di Michael. Ciò è irreprensibile in termini di consigli pratici. Inoltre, dice quello che penso praticamente tutti gli statistici credono, e ha diversi voti a sostegno di questo. Tuttavia, come un pezzo di teoria, non è letteralmente corretto. Ho scoperto questo elaborando le formule per i valori p e poi pensando attentamente come utilizzare le formule per condurre a contro-esempi. Sono un matematico di formazione e il controesempio è un "controesempio di matematico". Non è qualcosa che potresti incontrare nelle statistiche pratiche, il tipo di cosa che stavo cercando di scoprire quando ho posto la mia domanda originale.

Ecco il codice R che fornisce il contro-esempio:

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

Nota le seguenti caratteristiche: X e Y sono due 10 tuple la cui differenza è enorme e quasi costante. Per molte cifre significative, la correlazione è 1.000 .... Il valore p per il test non accoppiato è circa 10 ^ 40 volte più piccolo del valore p per il test accoppiato. Quindi questo contraddice il racconto di Michael, a condizione che si legga il suo resoconto letteralmente in stile matematico. Qui finisce la parte della mia risposta relativa alla risposta di Michael.


Ecco i pensieri spinti dalla risposta di Peter. Durante la discussione della mia domanda originale, ho ipotizzato in un commento che due particolari distribuzioni di valori p che suonano diversi sono in realtà le stesse. Ora posso provarlo. Ciò che è più importante è che la prova rivela la natura fondamentale di un valore p, così fondamentale che nessun testo (che mi sono imbattuto) disturba a spiegare. Forse tutti gli statistici professionisti conoscono il segreto, ma per me la definizione di p-value mi è sempre sembrata strana e artificiale. Prima di rivelare il segreto dello statistico, vorrei specificare la domanda.

n>1n2(n1)n1gradi di libertà. Queste due distribuzioni sono diverse, quindi come mai le distribuzioni associate dei valori p potrebbero essere le stesse? Solo dopo ulteriori riflessioni mi sono reso conto che questo ovvio licenziamento della mia congettura era troppo facile.

f:(0,)(0,)[0,1]

p=tf(s)ds
f(,)[0,)

[0,1]

n1[0,1]2(n1)[0,1][0,1]


Non credo che il valore p abbia sette misteriose. Alcune persone hanno un momento difficile con esso. È la probabilità di osservare un valore come estremo o più estremo di quello che è stato effettivamente osservato quando l'ipotesi nulla è VERA. Penso che tu l'abbia fatto bene in una delle tue formule. Penso che tu abbia affermato che i valori p sono distribuiti uniformemente. Sì, sono d'accordo con questo quando l'ipotesi nulla è vera. Tieni presente che con il tuo test t l'ipotesi nulla potrebbe non essere vera. Quindi il valore p non è uniforme. Dovrebbe essere concentrato più vicino a 0.
Michael R. Chernick,

In secondo luogo, stiamo parlando di due diverse statistiche di test. Uno si basa sull'associazione e uno non nel tuo esempio. Indipendentemente dal fatto che lo abbia menzionato nella mia risposta, il test t spaiato ha una distribuzione t centrale con 2n-2 gradi di libertà, mentre la corrispondente distribuzione t per il test t accoppiato ha n-1 gradi di libertà. Quindi quello con il maggior numero di gradi di libertà è più vicino alla distribuzione normale standard rispetto all'altro. Importa quando applichi questi test a dati reali? No! Non quando n è ragionevolmente grande.
Michael R. Chernick,

Come nota a margine, una limitazione del test accoppiato richiede la stessa dimensione del campione che si dovrebbe avere se tutti i dati possono essere accoppiati. Ma il test non accoppiato è valido con campioni di dimensioni diverse. Quindi in generale il test spaiato ha n + m-2 gradi di libertà.
Michael R. Chernick,

La tua risposta è lunga e astratta e ho provato a superarla ma non ho capito il controesempio. Semplicemente non vedo dove prendi in considerazione l'ipotesi nulla e i dati reali. Il valore p osservato è l'integrale della distribuzione t appropriata per la statistica del test dati i dati. Si confrontano quei numeri per le due distribuzioni t e lo stesso set di dati comune. Se si condizionano i dati osservati, queste distribuzioni uniformi non svolgono alcun ruolo. Mi dispiace ma non vedo che la tua risposta risponda davvero alla tua domanda.
Michael R. Chernick,

Michael: concentrati solo sul codice R che ho dato. Ci vuole solo un secondo per correre. L'ipotesi nulla è che X e Y provengano dalla stessa distribuzione normale, che è ovviamente selvaggiamente falsa nel mio caso. Nel mio esempio Cov (X, Y)> 0 e tuttavia il test spaiato dà più significato del test accoppiato.
David Epstein,

1

Vorrei offrire un'altra prospettiva. Spesso l'associazione viene eseguita per ridurre la distorsione. Supponiamo che tu sia interessato a sapere se l'esposizione E è un fattore di rischio per un risultato continuo Y. Per ogni soggetto E +, ottieni un soggetto corrispondente all'età e al sesso che è E-. Ora, potremmo eseguire un test t accoppiato o un test t non accoppiato. Penso che dovremmo tenere conto della corrispondenza esplicita e condurre un test t accoppiato. È più di principio in quanto tiene conto del progetto. Se prendere in considerazione la corrispondenza nell'analisi è una questione del compromesso di bias varianza. La contabilità per la corrispondenza nell'analisi fornisce una maggiore protezione contro la distorsione, ma può aumentare la varianza. Fare un t-test spaiato può essere più efficiente, ma non fornirebbe alcuna protezione contro i pregiudizi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.