sfondo
Sto progettando una simulazione Monte Carlo che combina i risultati di una serie di modelli e voglio essere sicuro che la simulazione mi consentirà di fare ragionevoli affermazioni sulla probabilità del risultato simulato e sulla precisione di tale stima della probabilità.
La simulazione troverà la probabilità che una giuria proveniente da una determinata comunità condannerà un determinato imputato. Questi sono i passaggi della simulazione:
Utilizzando i dati esistenti, genera un modello di probabilità logistica ( M ) regredendo al "voto del primo scrutinio dei giurati" sui predittori demografici.
Utilizzare i metodi Monte Carlo per simulare 1.000 versioni di M (ovvero 1000 versioni dei coefficienti per i parametri del modello).
Seleziona una delle 1.000 versioni del modello ( M i ).
Empanel 1.000 giurie selezionando casualmente 1.000 serie di 12 "giurati" da una "comunità" ( C ) di individui con specifiche caratteristiche demografiche.
Calcola in modo deterministico la probabilità di un primo voto per colpevolezza per ciascun giurato utilizzando M i .
Rende ogni probabile voto di "giurato" in un determinato voto (basato sul valore maggiore o minore del valore selezionato casualmente tra 0-1).
Determinare il "voto finale" di ciascuna "giuria" utilizzando un modello (derivato da dati empirici) della probabilità che una giuria condannerà, in base alla percentuale di giurati che votano per convinzione al primo scrutinio.
Memorizza la percentuale di verdetti di colpevolezza per le 1000 giurie ( PG i ).
Ripetere i passaggi 3-8 per ciascuno dei 1.000 versioni simulate di M .
Calcolare il valore medio di PG e la relazione che, come la stima puntuale della probabilità di condanna in C .
Identificare i valori percentili 2,5 e 97,5 per PG e riportarlo come intervallo di confidenza 0,95.
Attualmente sto usando 1.000 giurati e 1.000 giurie sulla teoria secondo cui 1.000 estrazioni casuali da una distribuzione di probabilità - caratteristiche demografiche di C o versioni di M - riempiranno quella distribuzione.
Domande
Questo mi permetterà di determinare con precisione la precisione del mio preventivo? In tal caso, quante giurie ho bisogno di impanare per ogni calcolo PG i per coprire la distribuzione di probabilità di C (quindi evito distorsioni di selezione); posso usare meno di 1.000?
Grazie mille per qualsiasi aiuto!