Studio di simulazione: come scegliere il numero di iterazioni?


11

Vorrei generare dati con "Modello 1" e inserirli con "Modello 2". L'idea alla base è quella di studiare le proprietà di robustezza del "Modello 2". Sono particolarmente interessato al tasso di copertura dell'intervallo di confidenza al 95% (basato sull'approssimazione normale).

  • Come posso impostare il numero di esecuzioni iterative?
  • È vero che repliche più grandi del necessario possono provocare distorsioni spurie? Se è così, come va?

Cosa intendi con "tasso di copertura dell'intervallo di confidenza al 95%"? Se l'intervallo di confidenza è esatto o un buon intervallo approssimativo, copre il valore reale del parametro circa il 95% delle volte.
Michael R. Chernick,

1
Se stai generando un intervallo di confidenza basato sul Modello 2 per i dati generati nel Modello 1, questo sembra indicare che i due modelli sono correlati e contengono alcuni degli stessi parametri. Puoi spiegarci un po 'di più? Inoltre, quando dici "spurie" nel tuo secondo punto, intendi sbagliato o semplicemente poco importante? Un numero maggiore di simulazioni non dovrebbe produrre distorsioni, ma potrebbe rivelare una distorsione che ha poca importanza pratica che non vedresti con un numero più piccolo, simile a come puoi rilevare (cioè ottenere un significato statistico per) un effetto molto piccolo quando hanno una dimensione del campione molto grande.
Macro

@Michael Chernick: una copertura insufficiente, ad esempio, può essere raggiunta se l'errore standard è troppo piccolo. Ho modificato la mia domanda per specificare che uso gli intervalli di confidenza in base all'approssimazione normale.
user7064

@Macro: "Modello 1" genera dati normali con termini di errore eteroscedastici e "Modello 2" è il modello lineare standard.
user7064

Risposte:


10

Sulla base del tuo commento di follow-up sembra che tu stia provando a stimare la probabilità di copertura di un intervallo di confidenza quando assumi una varianza di errore costante quando la varianza di errore reale non è costante.

Il modo in cui penso a questo è che, per ogni corsa, l'intervallo di confidenza copre il valore vero o no. Definire una variabile indicatore:

Yi={1if the interval covers0if it does not

Quindi la probabilità di copertura che ti interessa è che puoi stimare in base alla proporzione del campione che penso sia ciò che stai proponendo.E(Yi)=p

Come posso impostare il numero di esecuzioni iterative?

p(1p)pp(1p)/nnn

p(1p)/n1/4n

δn1/4δ

In un'impostazione più generale, se si sta cercando di investigare le proprietà della distribuzione campionaria di uno stimatore mediante simulazione (ad es. Media e varianza), è possibile scegliere il numero di simulazioni in base alla precisione che si desidera ottenere in un analogo moda a quello descritto qui.

nnpn(1p)20

È vero che repliche più grandi del necessario possono provocare distorsioni spurie? Se è così, come va?

94.9999%


10

Uso spesso l'ampiezza degli intervalli di confidenza come metodo rapido e sporco per determinare il numero di iterazioni necessarie.

pXnXBin(n,p)

p^=X/npp(1p)/nnp^p^±1.96p^(1p^)/npp0.9521.960.950.05/n

0.1n

0.1=21.960.950.05/n.

n


(+1) sembra che abbiamo inviato una risposta molto simile all'incirca nello stesso momento, ma penso che la diversa lingua utilizzata possa essere utile ad alcuni.
Macro

Sì, anzi, non so ancora quale risposta accettare! Comunque, +1 per entrambi!
user7064

1
@Macro: +1 anche a te. La varianza e la larghezza dell'intervallo sono ovviamente più o meno equivalenti qui. Le grandi menti pensano allo stesso modo, e così anche le nostre. ;)
Martedì

n=(21.650.950.05/0.01)2

0

Population Standard Deviationnd95%d=1.96×Pop.Std.Devnn=(1.96×Pop.Std.Dev)2d2

Fare più simulazioni (supponendo che tutti i campioni siano generati da un processo casuale) non fa nulla per danneggiare la stima in termini di precisione o distorsione.

95%np(1p)n


4
Ciao @Michael. Penso che questa risposta non risponda al punto. L'OP sta cercando di indagare su come vengono modificate le proprietà di copertura di un intervallo di confidenza quando si assume una varianza costante ma la varianza vera non è costante.
Macro

@Macro: hai ragione. Ho deliberatamente inserito la domanda in un contesto più ampio per evitare risposte specifiche al problema di assumere una varianza costante.
user7064

@Macro Non faceva parte della domanda a cui ho risposto. Apparentemente ciò è stato chiarito in seguito. Sembra anche che ciò che era interessante fosse l'accuratezza di un intervallo di confidenza che utilizza l'approssimazione normale. Questo non sembra essere affrontato in nessuna delle risposte.
Michael R. Chernick,

4
@Michael, sì, lo so - il mio punto era più che tu (e io) abbiamo chiesto chiarimenti ma non hai aspettato il chiarimento prima di pubblicare la tua risposta. Ri: il tuo secondo commento, puoi investigare le proprietà di copertura di qualsiasi intervallo in questo modo, indipendentemente dal fatto che fosse basato o meno sull'approssimazione normale. Se ritieni che ci sia qualcosa di distinto da aggiungere che manca alle risposte esistenti, modifica la tua risposta in modo che tutti possiamo imparare.
Macro

@Macro Certo che sono d'accordo con te. Ho modificato la mia risposta a beneficio del PO. Ho il sospetto che non ci sia nulla nel contenuto che non potresti già sapere.
Michael R. Chernick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.