La ponderazione basata sulla precisione (ovvero la varianza inversa) è parte integrante della meta-analisi?


10

La ponderazione basata sulla precisione è fondamentale per la meta-analisi? Borenstein et al. (2009) scrivono che per rendere possibile la meta-analisi tutto ciò che è necessario è che:

  1. Gli studi riportano una stima puntuale che può essere espressa come un singolo numero.
  2. La varianza può essere calcolata per quella stima puntuale.

Non mi è immediatamente chiaro perché (2) sia strettamente necessario. Ma, in effetti, tutti i metodi di meta-analisi ampiamente accettati si basano su schemi di ponderazione basati sulla precisione (cioè varianza inversa), che richiedono una stima della varianza per la dimensione dell'effetto di ogni studio. Si noti che mentre il metodo Hedges (Hedges & Olkin, 1985; Hedges & Vevea, 1998) e il metodo Hunter e Schmidt (Hunter & Schmidt, 2004) utilizzano entrambi fondamentalmente la ponderazione delle dimensioni del campione, questi metodi si applicano solo alle differenze medie normalizzate e quindi richiedono una deviazione standard altrove. Ha senso che pesi inversamente proporzionali alla varianza in ogni studio ridurranno al minimo la varianza nello stimatore della dimensione complessiva dell'effetto, quindi questo schema di ponderazione è una caratteristica necessaria di tutti i metodi?

È possibile condurre una revisione sistematica senza accesso alla varianza per ciascuna dimensione di effetto e comunque chiamare il risultato una meta-analisi? La dimensione del campione sembrerebbe avere un potenziale come proxy per la precisione quando la varianza non è disponibile. Si potrebbe, ad esempio, utilizzare la ponderazione della dimensione del campione in uno studio in cui la dimensione dell'effetto è stata definita come differenza media grezza? In che modo ciò influenzerebbe la coerenza e l'efficienza della dimensione dell'effetto medio risultante?


una buona domanda Se si solleva una domanda specifica chiara, può aiutare il lettore.
Subhash C. Davar,

In particolare, sto cercando un modo per incorporare una misura dell'eterogeneità tra gli studi (ovvero effetti casuali) nel mio schema di ponderazione quando i dati sulla varianza non sono disponibili per tutti gli studi. Una versione precedente e più specifica della mia domanda è disponibile qui: stats.stackexchange.com/questions/155063/…
Jennifer

Risposte:


11

Alla domanda è difficile rispondere, perché è così indicativo di una confusione generale e di situazioni confuse in gran parte della letteratura meta-analitica (l'OP non è da biasimare qui - è la letteratura e la descrizione dei metodi , modelli e ipotesi che spesso sono un disastro).

Ma per farla breve: No, se vuoi combinare un mucchio di stime (che quantificano una sorta di effetto, un grado di associazione o qualche altro risultato ritenuto rilevante) ed è sensato combinare quei numeri, allora potresti semplicemente prendere la loro media (non ponderata) e sarebbe perfettamente a posto. Nulla di sbagliato in questo e sotto i modelli che assumiamo in genere quando conduciamo una meta-analisi, questo ti dà anche una stima imparziale (supponendo che le stime stesse siano imparziali). Quindi, no, non sono necessarie le varianze di campionamento per combinare le stime.

Quindi perché la ponderazione della varianza inversa è quasi sinonimo di fare una meta-analisi? Ciò ha a che fare con l'idea generale che attribuiamo maggiore credibilità a studi di grandi dimensioni (con varianze di campionamento minori) rispetto agli studi più piccoli (con varianze di campionamento maggiori). Infatti, secondo i presupposti dei soliti modelli, l'uso della ponderazione della varianza inversa porta allo stimatore imparziale della varianza uniformemente minima(UMVUE) - beh, in un certo senso, assumendo ancora stime imparziali e ignorando il fatto che le varianze di campionamento spesso non sono esattamente esattamente conosciute, ma sono stimate da sole e in modelli a effetti casuali, dobbiamo anche stimare la componente di varianza per l'eterogeneità, ma poi l'abbiamo appena trattata come una costante nota, che non è del tutto giusta ... ma sì, otteniamo l'UMVUE se usiamo la ponderazione della varianza inversa se socchiudiamo gli occhi molto duramente e ignoriamo alcuni di questi problemi.

Quindi, è in gioco l'efficienza dello stimatore, non l'imparzialità stessa. Ma anche una media non ponderata spesso non sarà molto meno efficiente rispetto all'utilizzo di una media ponderata a varianza inversa, specialmente nei modelli a effetti casuali e quando la quantità di eterogeneità è grande (nel qual caso il normale schema di ponderazione porta a pesi quasi uniformi Comunque!). Ma anche nei modelli a effetti fissi o con poca eterogeneità, la differenza spesso non è schiacciante.

E come hai detto, si possono anche facilmente considerare altri schemi di ponderazione, come la ponderazione per dimensione del campione o una sua funzione, ma ancora una volta questo è solo un tentativo di avvicinare qualcosa ai pesi di varianza inversa (poiché le varianze di campionamento sono, a in larga misura, determinato dalla dimensione del campione di uno studio).

Ma davvero, si può e si dovrebbe "disaccoppiare" la questione dei pesi e delle varianze. Sono davvero due pezzi separati a cui bisogna pensare. Ma non è così che le cose sono generalmente presentate in letteratura.

Tuttavia, il punto qui è che devi davvero pensare a entrambi. Sì, puoi prendere una media non ponderata come stima combinata e quella sarebbe, in sostanza, una meta-analisi, ma una volta che vuoi iniziare a fare inferenze basate su quella stima combinata (ad esempio, condurre un test di ipotesi, costruire un intervallo di confidenza ), è necessario conoscere le varianze di campionamento (e la quantità di eterogeneità). Pensaci in questo modo: se combini un mucchio di studi piccoli (e / o molto eterogenei), la tua stima puntuale sarà molto meno precisa rispetto a quando combini lo stesso numero di molto grandi (e / o omogenei) studi - indipendentemente da come hai ponderato le tue stime nel calcolo del valore combinato.

In realtà, ci sono anche alcuni modi per non conoscere le varianze di campionamento (e la quantità di eterogeneità) quando iniziamo a fare statistiche inferenziali. Si possono prendere in considerazione metodi basati sul ricampionamento (ad es. Bootstrap, test di permutazione) o metodi che producono errori standard coerenti per la stima combinata anche quando non specifichiamo parti del modello - ma quanto bene questi approcci potrebbero funzionare devono essere attentamente valutati su un caso per caso.


0

Se conosci alcuni degli errori standard ma non tutti, ecco una soluzione:

(1) supponiamo che la SE sconosciuta sia disegnata casualmente dalla stessa distribuzione delle SE note o lascia che la distribuzione della SE delle stime dei documenti con SE sconosciuta sia una variabile libera. Se vuoi essere sofisticato, puoi utilizzare la media del modello su queste opzioni.

(2) stima tramite la massima probabilità

Se il tuo studio con SE sconosciuto è un "valore anomalo", il modello spiegherà l'anomalia in una combinazione di questi modi:

(a) lo studio ha probabilmente avuto un alto SE per la sua stima (lo studio ha probabilmente una bassa potenza)

(b) lo studio ha probabilmente una grande componente di effetti casuali (il ricercatore ha scelto un set di dati o un metodo ecc. che danno un risultato atipico)

In effetti, questo modello ridurrà l'effettiva precisione della stima con SE sconosciuto man mano che diventa più anomala. A questo proposito, è estremamente solido l'inclusione di "valori anomali". Allo stesso tempo, se aggiungi molti studi con varianza sconosciuta ma con risultati tipici, la SE o la tua stima finale diminuiranno.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.