Come parametrizzare il rapporto tra due variabili normalmente distribuite o l'inverso di una?


12

Problema: sto parametrizzando le distribuzioni da utilizzare come priori e dati in una meta-analisi bayesiana. I dati sono forniti in letteratura come statistiche riassuntive, si presume quasi esclusivamente di essere distribuiti normalmente (anche se nessuna delle variabili può essere <0, alcune sono rapporti, altre sono masse, ecc.).

Mi sono imbattuto in due casi per i quali non ho soluzione. A volte il parametro di interesse è l'inverso dei dati o il rapporto di due variabili.

Esempi:

  1. il rapporto tra due variabili normalmente distribuite:
    • dati: media e sd per percentuale di azoto e percentuale di carbonio
    • parametro: rapporto tra carbonio e azoto.
  2. l'inverso di una variabile normalmente distribuita:
    • dati: massa / area
    • parametro: area / massa

Il mio approccio attuale è usare la simulazione:

ad es. per un insieme di dati percentuali di carbonio e azoto con media: xbar.n, c, varianza: se.n, c, e dimensione del campione: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Voglio parametrizzare ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Quindi scegliere le distribuzioni più adatte con intervallo per il mio precedente0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Domanda: è un approccio valido? Ci sono altri / migliori approcci?

Grazie in anticipo!

Aggiornamento: la distribuzione di Cauchy, che è definita come il rapporto di due normali con , ha un'utilità limitata poiché vorrei stimare la varianza. Forse potrei calcolare la varianza di una simulazione di n disegni da un Cauchy?μ=0

Ho trovato le seguenti approssimazioni in forma chiusa ma non ho provato a vedere se danno gli stessi risultati ... Hayya et al, 1975 σ 2 y : x =σ 2 x ×μy/mu 4

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. e Armstrong, D. e Gressis, N., 1975. Una nota sul rapporto tra due variabili normalmente distribuite. Management Science 21: 1338-1341


dovrei pubblicare la domanda di aggiornamento sul calcolo della varianza dei sorteggi casuali dal Cauchy come domanda separata?
David LeBauer,

david - dal momento che le tue variabili sono tutte positive, perché vuoi litigare con ? btw - nella tua simulazione, sembra che stai generando variabili per.c e per.n che sono indipendenti. è corretto - e se è così, è quello che vuoi? μ=0
ronaf,

no, non voglio agitarmi con = 0; queste variabili sono generalmente trattate come indipendenti e raramente sono disponibili dati sulla covarianza. Poiché C è abbastanza costante, l'indipendenza è un presupposto ragionevole. μ
David LeBauer,

Non capisco perché non esista l'aspettativa del rapporto. Se e sono normalmente distribuiti congiuntamente con una media diversa da zero, la media di è data da , cosa mi sto perdendo? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi,

Risposte:


6

Potresti voler dare un'occhiata ad alcuni dei riferimenti sotto l'articolo di Wikipedia su Ratio Distribution . È possibile trovare approssimazioni o distribuzioni migliori da utilizzare. Altrimenti, il tuo approccio sembra sano.

Aggiornamento Penso che un riferimento migliore potrebbe essere:

Vedi le formule 2-4 a pagina 195.

Aggiornamento 2

Sulla tua domanda aggiornata sulla varianza da un Cauchy - come ha sottolineato John Cook nei commenti, la varianza non esiste. Quindi, prendere una varianza di esempio semplicemente non funzionerà come uno "stimatore". In effetti, scoprirai che la varianza del tuo campione non converge affatto e fluttua selvaggiamente mentre continui a prelevare campioni.


Grazie per il riferimento, è qui che ho trovato il riferimento Haaya del 1975 e le equazioni nella mia domanda, anche se apprezzerei la sicurezza che le equazioni siano appropriate al mio problema.
David LeBauer,

Dando una rapida occhiata a Haaya, sembra che si stiano occupando di ottenere un'approssimazione normale per il rapporto e usare simulazioni per determinare quando ciò si applica (usando il coefficiente di variazione, cv). Il CV nel tuo caso soddisfa i criteri? In tal caso, si applicano le approssimazioni.
ars

1
@ David: usa invece Marsaglia 1965 come aggiornato nella risposta.
ars

NB: Marsaglia ha pubblicato un aggiornamento su JSS nel 2004 .
David LeBauer,

Non capisco perché non esista l'aspettativa del rapporto. Se e sono normalmente distribuiti congiuntamente con una media diversa da zero, la media di è data da , cosa mi sto perdendo? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi,

0

Non potresti supporre che Per l'inverso di una normale variabile casuale e fare il necessario calcolo bayesiano dopo aver identificato i parametri appropriati per la distribuzione normale.y1N(.,.)

Il mio suggerimento di seguito per usare il Cauchy non funziona come sottolineato nei commenti di ars e John.

Il rapporto tra due variabili normalmente casuali segue la distribuzione di Cauchy . Potresti voler usare questa idea per identificare i parametri del cauchy che più si adattano ai dati che hai.


un. Devo stimare la varianza e la varianza della distribuzione di Cauchy non è definita.
David LeBauer,

b. Se capisco il tuo secondo punto, sì, potrei supporre che y-1 ~ N (mu, sigma), ma ho ancora bisogno di calcolare mu e sigma dalle statistiche riassuntive fornite per y; inoltre, ho scelto di non considerare le distribuzioni con valori <0 solo per variabili definite> 0 (anche se in molti casi p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer

Il Cauchy non fa domanda per zero normali normali?
ars

@ars Hai ragione. Il cauchy quindi potrebbe essere di utilità limitata.

Ars: Sì, credo che il risultato di Cauchy richieda zero mezzi. Ma ciò significa ancora che almeno in quel caso speciale, la varianza che David sta cercando di stimare NON ESISTE.
John D. Cook,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.