Sono corrette queste formule per trasformare P, LSD, MSD, HSD, CI, in SE come stima esatta o gonfiata / conservativa di ?

11

sfondo

Sto conducendo una meta-analisi che include dati precedentemente pubblicati. Spesso, le differenze tra i trattamenti sono riportate con valori di P, differenze meno significative (LSD) e altre statistiche ma non forniscono una stima diretta della varianza.

Nel contesto del modello che sto usando, una sopravvalutazione della varianza va bene.

Problema

Ecco un elenco di trasformazioni in dove (Saville 2003) che sto prendendo in considerazione, feedback apprezzato; sotto, presumo che quindi e le variabili sono normalmente distribuite se non diversamente indicato: $SE$ $SE=\sqrt{MSE/n}$ $\alpha=0.05$ $1-^{\alpha}/_2=0.975$

Domande:

dato , e trattamento significa e $P$ $n$ $\bar X_1$ $\bar X_2$
$S E = \frac{{\bar{X}}_{1} - {\bar{X}}_{2}}{t_{(1 - \frac{P}{2}, 2 n - 2)} \sqrt{2 / n}}$ $SE=\frac{\bar X_1-\bar X_2}{t_{(1-\frac{P}{2},2n-2)}\sqrt{2/n}}$
dato LSD (Rosenberg 2004) , , , dove è il numero di blocchi e per impostazione predefinita per RCBD $\alpha$ $n$ $b$ $b$ $n=b$
$S E = \frac{L S D}{t_{(0.975, n)} \sqrt{2 b n}}$ $SE = \frac{LSD}{t_{(0.975,n)}\sqrt{2bn}}$
dato MSD (differenza significativa minima) (Wang 2000) , , , df = $n$ $\alpha$ $2n-2$
$S E = \frac{M S D}{t_{(0.975, 2 n - 2)} \sqrt{2}}$ $SE = \frac{MSD}{t_{(0.975, 2n-2)}\sqrt{2}}$
dato un intervallo di confidenza al 95% (Saville 2003) (misurato dalla media al limite di confidenza superiore o inferiore), e $\alpha$ $n$
$S E = \frac{C I}{t_{(α / 2, n)}}$ $SE = \frac{CI}{t_{(\alpha/2,n)}}$
dato l'HSD di Tukey, , dove è la "statistica dell'intervallo studentizzato", $n$ $q$
$S E = \frac{H S D}{q_{(0.975, n)}}$ $SE = \frac{HSD}{q_{(0.975,n)}}$

Una funzione R per incapsulare queste equazioni:

Dati di esempio:

data <- data.frame(Y=rep(1,5), 
                   stat=rep(1,5), 
                   n=rep(4,5), 
                   statname=c('SD', 'MSE', 'LSD', 'HSD', 'MSD')

Esempio di utilizzo:
```
transformstats(data)    
```

La transformstatsfunzione:

transformstats <- function(data) {
  ## Transformation of stats to SE
  ## transform SD to SE
  if ("SD" %in% data$statname) {
    sdi <- which(data$statname == "SD")
    data$stat[sdi] <- data$stat[sdi] / sqrt(data$n[sdi])
    data$statname[sdi] <- "SE"
      }
  ## transform MSE to SE
  if ("MSE" %in% data$statname) {
    msei <- which(data$statname == "MSE")
    data$stat[msei] <- sqrt (data$stat[msei]/data$n[msei])
    data$statname[msei] <- "SE"
  }
  ## 95%CI measured from mean to upper or lower CI
  ## SE = CI/t
  if ("95%CI" %in% data$statname) {
    cii <- which(data$statname == '95%CI')
    data$stat[cii] <- data$stat[cii]/qt(0.975,data$n[cii])
    data$statname[cii] <- "SE"
  }
  ## Fisher's Least Significant Difference (LSD)
  ## conservatively assume no within block replication
  if ("LSD" %in% data$statname) {
    lsdi <- which(data$statname == "LSD")
    data$stat[lsdi] <- data$stat[lsdi] / (qt(0.975,data$n[lsdi]) * sqrt( (2 * data$n[lsdi])))
    data$statname[lsdi] <- "SE"
  }
  ## Tukey's Honestly Significant Difference (HSD),
  ## conservatively assuming 3 groups being tested so df =2
  if ("HSD" %in% data$statname) {
    hsdi <- which(data$statname == "HSD" & data$n > 1)
    data$stat[hsdi] <- data$stat[hsdi] / (qtukey(0.975, data$n[lsdi], df = 2))
    data$statname[hsdi] <- "SE"
  }              
  ## MSD Minimum Squared Difference
  ## MSD = t_{\alpha/2, 2n-2}*SD*sqrt(2/n)
  ## SE  = MSD*n/(t*sqrt(2))
  if ("MSD" %in% data$statname) {
    msdi <- which(data$statname == "MSD")
    data$stat[msdi] <- data$stat[msdi] * data$n[msdi] / (qt(0.975,2*data$n[lsdi]-2)*sqrt(2))
    data$statname[msdi] <- "SE"
  }
  if (FALSE %in% c('SE','none') %in% data$statname) {
    print(paste(trait, ': ERROR!!! data contains untransformed statistics'))
  }
  return(data)
}

Riferimenti

Saville 2003 Can J. Exptl Psych. (PDF)

Rosenberg et al 2004 (link)

Wang et al. 2000 Env. Tox. e Chem 19 (1): 113-117 (link)

— David
fonte

Non sono sicuro che la maggior parte degli EC sia realmente calcolata tramite valori t o piuttosto tramite valori z. Tuttavia, su ns più grandi (> 30) questo non dovrebbe fare molta differenza.

— Henrik,

@Henrik per la piccola , la statistica t è appropriata e, come hai detto, all'aumentare di , t si avvicina a Z. Vedi anche math.stackexchange.com/q/23246/3733

n

$n$

n

$n$

— David LeBauer,

7

La tua equazione LSD sembra a posto. Se vuoi tornare alla varianza e hai una statistica riassuntiva che dice qualcosa sulla variabilità o sul significato di un effetto, puoi quasi sempre tornare alla varianza, devi solo conoscere la formula. Ad esempio, nella tua equazione per LSD che vuoi risolvere per MSE, MSE = (LSD / t _) ^ 2/2 * b

— John
fonte

Per MSD, se MSD = t_ {alpha, 2n-2} * sd sqrt (2 / n), SE = MSD n / (t_ {alpha, n} * sqrt (2)) è corretto?

— David LeBauer,

7

Posso solo essere d'accordo con John. Inoltre, forse questo articolo di David Saville ti aiuta con qualche formula per ricalcolare le misure di variabilità da LSDs e altri .:
Saville DJ (2003). Statistiche di base e incoerenza di più procedure di confronto. Canadian Journal of Experimental Psychology, 57, 167–175

AGGIORNAMENTO:
Se stai cercando più formule da convertire tra varie dimensioni di effetto, i libri sulla meta-analisi dovrebbero fornire molte di queste. Tuttavia, non sono un esperto in questo settore e non posso raccomandarlo.
Ma ricordo che una volta il libro di Rosenthal e Rosnow mi ha aiutato con qualche formula:
Elementi essenziali della ricerca comportamentale: metodi e analisi dei dati
Inoltre, ho sentito molte cose buone sulle formule in questo libro di Rosenthal, Rosnow & Rubin (anche se Non l'ho mai usato):
Contrasti e dimensioni dell'effetto nella ricerca comportamentale: un approccio correlativo (dovresti assolutamente provarlo se una biblioteca vicina ce l'ha).

Se ciò non bastasse, forse fai un'altra domanda in letteratura per convertire le dimensioni degli effetti in meta-analisi. Forse qualcuno più in meta-analisi ha raccomandazioni più fondate.

— Henrik
fonte

0

Puoi provare a provare il pacchetto R compute.es . Esistono diverse funzioni per derivare le stime della dimensione dell'effetto e la varianza della dimensione dell'effetto.

— utente3752
fonte

questo è un bel pacchetto che hai scritto, ma sono interessato a stimare il campione SE, e queste funzioni sembrano fornire stime di varianza per le dimensioni dell'effetto meta-analisi, mentre vorrei inferire la varianza della popolazione (ad es. i dati originali). Potresti fornire un esempio di come le funzioni nel compute.espacchetto potrebbero essere utilizzate per replicare le equazioni e le funzioni che ho scritto sopra?

— David LeBauer,