Combinazione di due intervalli di confidenza / stime dei punti


17

Supponiamo che uno abbia due campioni indipendenti della stessa popolazione e che sui due campioni siano stati usati metodi diversi per ricavare la stima puntuale e gli intervalli di confidenza. In casi insignificanti, una persona sensibile raggrupperebbe semplicemente i due campioni e userebbe un metodo per fare l'analisi, ma supponiamo per il momento che si debba usare un metodo diverso a causa della limitazione di uno dei campioni come i dati mancanti. Queste due analisi separate genererebbero stime indipendenti e ugualmente valide per l'attributo della popolazione di interesse. Intuitivamente penso che dovrebbe esserci un modo per combinare correttamente queste due stime, sia in termini di stima puntuale che di intervallo di confidenza, risultando in una migliore procedura di stima. La mia domanda è: quale dovrebbe essere il modo migliore per farlo? Posso immaginare una media ponderata di qualche tipo in base alle informazioni / dimensione del campione in ciascun campione, ma per quanto riguarda gli intervalli di confidenza?

Risposte:


9

È possibile effettuare una stima aggregata come segue. È quindi possibile utilizzare le stime aggregate per generare un intervallo di confidenza combinato. In particolare, lasciamo:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

Utilizzando gli intervalli di confidenza per i due casi, è possibile ricostruire gli errori standard per le stime e sostituire quanto sopra con:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Una stima aggregata sarebbe:

x¯=n1x1¯+n2x2¯n1+n2

Così,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)


1
Questo approccio funziona se assumiamo che il nostro CI sono di forma ß ± Z α S E . Sfortunatamente, a volte l'IC asimmetrico può essere più sensato, ad esempio l'IC per una proporzione binomiale quando è vicino a 0. In tal caso, la messa in comune della SE in questo modo potrebbe non essere d'aiuto. β^±ZαSE
user1600

@ user1600 Un buon punto.

Questa risposta potrebbe essere applicata a qualsiasi due distribuzioni, è solo che il prodotto delle normali è normale, dando una buona soluzione. La simulazione MCMC potrebbe essere utilizzata con coppie di distribuzioni senza una soluzione in forma chiusa, usando un approccio bayesiano con un campione che è il precedente e l'altro la probabilità.
David LeBauer,

Se tornando ad intervalli di confidenza dall'ES aggregata, quali sarebbero i gradi di libertà per la distribuzione T? Questo cambierebbe se si combinano più di 2 intervalli di confidenza?
DocBuckets

3

Mi sembra molto una meta-analisi . Il tuo presupposto che i campioni provengano dalla stessa popolazione significa che puoi usare la meta-analisi ad effetto fisso (piuttosto che la meta-analisi ad effetti casuali). Il metodo generico di varianza inversa prende come input un insieme di stime indipendenti e le loro varianze, quindi non richiede i dati completi e funziona anche se sono stati utilizzati stimatori diversi per campioni diversi. La stima combinata è quindi una media ponderata delle stime separate, ponderando ciascuna stima con l'inverso della sua varianza. La varianza della stima combinata è l'inverso della somma dei pesi (le inversioni delle varianze).

Volete lavorare su una scala in cui la distribuzione campionaria della stima è approssimativamente normale, o almeno una scala in cui gli intervalli di confidenza sono approssimativamente simmetrici, quindi una scala trasformata in log è normale per le stime del rapporto (rapporti di rischio, rapporti di probabilità, tasso rapporti ...). In altri casi a sarebbe utile una trasformazione stabilizzante la varianza , ad esempio una trasformazione radice quadrata per i dati di Poisson, una trasformazione arca-radice quadrata per i dati binomiali, ecc.


1

Questo non è diverso da un campione stratificato. Quindi, raggruppare i campioni per una stima puntuale e un errore standard sembra un approccio ragionevole. I due campioni verrebbero ponderati in base alla proporzione del campione.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.