Ottenere e interpretare gli intervalli di confidenza avviati da dati gerarchici


10

Sono interessato a ottenere un intervallo di confidenza avviato dalla quantità X, quando questa quantità viene misurata 10 volte in ciascuna delle 10 persone.

Un approccio consiste nell'ottenere la media per individuo, quindi avviare i mezzi (ad es. Ricampionare i mezzi con la sostituzione).

Un altro approccio consiste nel fare quanto segue ad ogni iterazione della procedura di bootstrap: all'interno di ogni individuo, ricampionare le 10 osservazioni di quell'individuo con la sostituzione, quindi calcolare un nuovo mezzo per quell'individuo e infine calcolare un nuovo mezzo di gruppo. In questo approccio, ogni individuo osservato nel set di dati originale contribuisce sempre alla media del gruppo su ogni iterazione della procedura bootstrap.

Infine, un terzo approccio è quello di combinare i due approcci precedenti: ricampionare gli individui e poi ricampionare all'interno di quegli individui. Questo approccio differisce dall'approccio precedente in quanto consente allo stesso individuo di contribuire alla moltiplicazione media del gruppo su ciascuna iterazione, sebbene poiché ogni contributo sia generato attraverso una procedura di ricampionamento indipendente, è possibile che ci si aspetti che questi contributi differiscano leggermente l'uno dall'altro.

In pratica, trovo che questi approcci producano stime diverse per l'intervallo di confidenza (es. Con un set di dati, trovo che il terzo approccio produca intervalli di confidenza molto più ampi rispetto ai primi due approcci), quindi sono curioso di sapere quale potrebbe essere ciascuno interpretato per rappresentare.

Risposte:


7

Il tuo primo approccio riguarda una tra S CI. Se volevi misurare all'interno di S, questo è l'approccio sbagliato.

Il secondo approccio genererebbe un SCI interno che si applicherebbe solo a quei 10 individui.

L'ultimo approccio è quello corretto all'interno di S CI. Qualsiasi aumento dell'IC è dovuto al fatto che l'IC è più rappresentativo di un elemento della configurazione che potrebbe essere applicato alla popolazione anziché a quelle 10 S.


6

Secondo Davison e Hinckley ("Metodi Bootstrap e loro applicazione", 1997, Sezione 3.8), il terzo algoritmo è conservativo. Sostengono un quarto approccio: semplicemente ricampionare i soggetti.


1
Interessante, dovrò cercare quel riferimento. Sei sicuro di voler dire "quarto" approccio? Il primo approccio che ho elencato sembra descrivere "semplicemente ricampionare i soggetti".
Mike Lawrence,

1
Sì, lo fa, ma descrive il ricampionamento del soggetto. Il difensore di D&H ricampiona i soggetti e adatta il modello originale.
Andrew Robinson,

2
Ti potrebbe piacere anche vedere il recente pubblicato: Ren, Shiquan, Lai, Hong, Tong, Wenjing, Aminzadeh, Mostafa, Hou, Xuezhang e Lai, Shenghan (2010) 'Bootstrap non parametrico per dati gerarchici', Journal of Applied Statistics, 37: 9, 1487-1498
Andrew Robinson,

2
@Mike: ricampionare l'intero clsuter è ciò che gli statistici del sondaggio fanno nei loro bootstrap. Questa è davvero una procedura diversa che sarebbe equivalente al tuo "primo" approccio se (i) stai solo stimando la media e (ii) i dati non sono ponderati ed equilibrati. Vedi anche citeulike.org/user/ctacmo/article/1334050 , citeulike.org/user/ctacmo/article/1475866 , citeulike.org/user/ctacmo/article/582039 .
StasK,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.