Come "controlli" un fattore / variabile?


19

A mio avviso, "Controllo" può avere due significati nelle statistiche.

  1. Gruppo di controllo: in un esperimento, non viene dato alcun trattamento al membro del gruppo di controllo. Es .: Placebo vs Drug: dai farmaci a un gruppo e non all'altro (controllo), che viene anche definito "esperimento controllato".

  2. Controllo per una variabile: tecnica di separazione dell'effetto di una particolare variabile indipendente. Alcuni degli altri nomi dati a questa tecnica sono "contabilità", "tenuta costante", "controllo per", alcune variabili. Ad esempio: in uno studio sulla visione del calcio (simile o meno), potresti voler eliminare l'effetto del genere poiché pensiamo che il genere causi distorsioni, cioè al maschio potrebbe piacere di più rispetto alla femmina.

Quindi, la mia domanda è per il punto (2). Due domande:

Come "controlli" / "conti" le variabili, in generale. Quali tecniche vengono utilizzate? (In termini di regressione, quadro ANOVA).

Nell'esempio sopra, la scelta maschile e femminile costituisce casualmente controllo? Cioè, la "casualità" è una delle tecniche per controllare altri effetti?


3
In termini di regressione e ANOVA, il controllo per una variabile di solito significa che la variabile è stata inclusa nel modello.
Glen,

Come dice Glen, includerlo nel modello è la strada da percorrere. Tuttavia, la randomizzazione viene utilizzata per prevenire la distorsione da effetti non inclusi nel modello. Una volta generato un disegno, spesso le persone controbilanciano per assicurarsi che cose come lo stesso numero di ciascun genere in ogni trattamento. Il problema di affidarsi esclusivamente alla randomizzazione e al contrappeso è che convertono quel pregiudizio in varianza e quindi è più difficile osservare quali dei tuoi fattori sono attivi.
neverKnowsBest

Risposte:


16

Come già detto, controllare di solito significa includere una variabile in una regressione (come sottolineato da @EMS, questo non garantisce alcun successo nel raggiungimento di questo, si collega a questo ). Esistono già alcune domande e risposte molto votate su questo argomento, come:

Le risposte accettate su queste domande sono tutti ottimi trattamenti della domanda che stai ponendo all'interno di un quadro osservazionale (direi correlativo), più di queste domande possono essere trovate qui .

Tuttavia, stai ponendo la tua domanda in modo specifico all'interno di un quadro sperimentale o ANOVA, è possibile dare qualche riflessione in più su questo argomento.

All'interno di una struttura sperimentale controlli una variabile randomizzando gli individui (o altre unità di osservazione) sulle diverse condizioni sperimentali. L'ipotesi di base è che di conseguenza l'unica differenza tra le condizioni è il trattamento sperimentale. Quando si randomizza correttamente (vale a dire, ogni individuo ha le stesse possibilità di essere in ogni condizione) questo è un presupposto ragionevole. Inoltre, solo la randomizzazione ti consente di trarre inferenze causali dalla tua osservazione poiché questo è l'unico modo per assicurarti che nessun altro fattore sia responsabile dei tuoi risultati.

Tuttavia, può anche essere necessario controllare le variabili all'interno di un framework sperimentale, vale a dire quando esiste un altro fattore noto che influenza anche quella variabile dipendente. Per migliorare il potere statistico e può quindi essere una buona idea controllare per questa variabile. La normale procedura statistica utilizzata per questo è l'analisi della covarianza (ANCOVA), che in pratica aggiunge anche la variabile al modello.

Ora arriva il punto cruciale: affinché ANCOVA sia ragionevole, è assolutamente cruciale che l'assegnazione ai gruppi sia casuale e che la covariata per cui è controllata non sia correlata alla variabile di raggruppamento.
Questo purtroppo viene spesso ignorato portando a risultati non interpretabili. Miller & Chapman (2001) fornisce un'introduzione davvero leggibile a questo preciso problema (ovvero quando usare ANCOVA o meno ) :

Nonostante numerosi trattamenti tecnici in molti luoghi, l'analisi della covarianza (ANCOVA) rimane un approccio ampiamente abusato per affrontare le differenze sostanziali di gruppo sulle potenziali covariate, in particolare nella ricerca psicopatologica. Gli articoli pubblicati giungono a conclusioni infondate e alcuni testi statistici trascurano il problema. Il problema con ANCOVA in questi casi viene esaminato. In molti casi, non esiste alcun modo per raggiungere l'obiettivo superficialmente attraente di "correggere" o "controllare" differenze reali di gruppo su una potenziale covariata. Nella speranza di limitare l'uso improprio di ANCOVA e di promuovere un uso appropriato, viene fornita una discussione non tecnica, sottolineando un confusione sostanziale raramente articolata in libri di testo e altre presentazioni generali, a complemento delle critiche matematiche già disponibili.


Miller, GA e Chapman, JP (2001). Analisi incomprensibile della covarianza. Journal of Abnormal Psychology , 110 (1), 40–48. DOI: 10,1037 / 0021-843X.110.1.40


Solo per enfatizzare il punto su questa domanda (che viene ripetuta molto spesso), è bene considerare che l'inclusione di una variabile in un modello non è garantita per "controllare" il suo effetto, anche in base a presupposti estremamente forti sull'essere variabile monotonicamente correlato alla variabile dipendente. Vedi l'articolo che è collegato nel mio altro commento.
ely,

1
@EMS Un buon punto. Ho aggiunto una nota cautelativa e il tuo link all'inizio del testo. Sentiti libero di modificare il mio testo se ritieni che ci sia altro da aggiungere.
Henrik,

0

Per controllare una variabile, è possibile equalizzare due gruppi su un tratto rilevante e quindi confrontare la differenza sul problema che si sta cercando. Posso solo spiegarlo con un esempio, non formalmente, la scuola B è anni passati, quindi lì.

Se diresti:

Il Brasile è più ricco della Svizzera perché il Brasile ha un reddito nazionale di 3524 miliardi di dollari e la Svizzera solo 551 miliardi

saresti corretto in termini assoluti, ma chiunque abbia più di 12 anni con una conoscenza passeggera del mondo sospetterebbe che ci sia qualcosa di sbagliato anche in quella affermazione.

Sarebbe meglio elevare la popolazione svizzera a quella brasiliana e poi confrontare nuovamente le entrate. Quindi, se la popolazione svizzera avesse le dimensioni dei brasiliani il loro reddito sarebbe:

(210 milioni / 8,5 milioni) * 551 miliardi di dollari = 13612 miliardi di dollari

Questo li rende circa 4 volte più ricchi del Brasile con 3524 miliardi di dollari.

E sì, puoi anche adottare l'approccio pro capite, in cui confronti i redditi medi. Ma l'approccio di cui sopra, è possibile applicare più volte.


1
Sembra che tu stia descrivendo una qualche forma di normalizzazione piuttosto che "controllo" nel senso che si intende nella domanda.
whuber

In realtà, penso che siano gli stessi. Se non la pensi così, sentiti libero di approfondire la differenza tra i due
Heccate Newb,

Non penso di dover aggiungere altre risposte già presenti in questo thread.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.