Esiste un modo numericamente stabile per calcolare i valori di una distribuzione beta per numeri interi grandi alpha, beta (ad esempio alpha, beta> 1000000)?
In realtà, ho solo bisogno di un intervallo di confidenza del 99% attorno alla modalità, se ciò in qualche modo semplifica il problema.
Aggiungi : mi dispiace, la mia domanda non è stata espressa chiaramente come pensavo. Quello che voglio fare è questo: ho una macchina che ispeziona i prodotti su un nastro trasportatore. Una parte di questi prodotti viene rifiutata dalla macchina. Ora, se l'operatore della macchina modifica alcune impostazioni di ispezione, voglio mostrargli la percentuale di scarto stimata e qualche suggerimento su quanto sia affidabile la stima attuale.
Quindi ho pensato di trattare il tasso di rifiuto effettivo come una variabile casuale X e calcolare la distribuzione di probabilità per quella variabile casuale in base al numero di oggetti rifiutati N e oggetti accettati M. Se presumo una distribuzione precedente uniforme per X, questa è una distribuzione beta a seconda di N e M. Posso visualizzare questa distribuzione direttamente all'utente o trovare un intervallo [l, r] in modo che il tasso di rifiuto effettivo sia in questo intervallo con p> = 0,99 (usando la terminologia di shabbychef) e visualizzarlo intervallo. Per piccole M, N (cioè subito dopo la modifica dei parametri), posso calcolare direttamente la distribuzione e approssimare l'intervallo [l, r]. Ma per grandi M, N, questo approccio ingenuo porta a errori di underflow, perché x ^ N * (1-x) ^ M è troppo piccolo per essere rappresentato come un float a doppia precisione.
Immagino che la mia scommessa migliore sia usare la mia ingenua distribuzione beta per la piccola M, N e passare a una distribuzione normale con la stessa media e varianza non appena M, N supera una certa soglia. Ha senso?