Problema: sto parametrizzando le distribuzioni da utilizzare come priori e dati in una meta-analisi bayesiana. I dati sono forniti in letteratura come statistiche riassuntive, si presume quasi esclusivamente di essere distribuiti normalmente (anche se nessuna delle variabili può essere <0, alcune sono rapporti, altre sono masse, ecc.).
Mi sono imbattuto in due casi per i quali non ho soluzione. A volte il parametro di interesse è l'inverso dei dati o il rapporto di due variabili.
Esempi:
- il rapporto tra due variabili normalmente distribuite:
- dati: media e sd per percentuale di azoto e percentuale di carbonio
- parametro: rapporto tra carbonio e azoto.
- l'inverso di una variabile normalmente distribuita:
- dati: massa / area
- parametro: area / massa
Il mio approccio attuale è usare la simulazione:
ad es. per un insieme di dati percentuali di carbonio e azoto con media: xbar.n, c, varianza: se.n, c, e dimensione del campione: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Voglio parametrizzare ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Quindi scegliere le distribuzioni più adatte con intervallo per il mio precedente
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Domanda: è un approccio valido? Ci sono altri / migliori approcci?
Grazie in anticipo!
Aggiornamento: la distribuzione di Cauchy, che è definita come il rapporto di due normali con , ha un'utilità limitata poiché vorrei stimare la varianza. Forse potrei calcolare la varianza di una simulazione di n disegni da un Cauchy?
Ho trovato le seguenti approssimazioni in forma chiusa ma non ho provato a vedere se danno gli stessi risultati ... Hayya et al, 1975 σ 2 y : x =σ 2 x ×μy/mu 4
Hayya, J. e Armstrong, D. e Gressis, N., 1975. Una nota sul rapporto tra due variabili normalmente distribuite. Management Science 21: 1338-1341