Supponiamo che io inserisca una regressione binomiale e ottenga le stime puntuali e la matrice varianza-covarianza dei coefficienti di regressione. Ciò mi consentirà di ottenere un elemento della configurazione per la proporzione attesa di successi in un futuro esperimento, , ma ho bisogno di un elemento della configurazione per la proporzione osservata. Sono state pubblicate alcune risposte correlate, tra cui la simulazione (supponiamo che io non voglia farlo) e un link a Krishnamoorthya et al (che non risponde perfettamente alla mia domanda).
Il mio ragionamento è il seguente: se usiamo solo il modello binomiale, siamo costretti ad assumere che sia campionato dalla distribuzione normale (con il corrispondente CI CI) e quindi è impossibile ottenere CI per la proporzione osservata in forma chiusa. Se assumiamo che sia campionato dalla distribuzione beta, allora le cose sono molto più facili perché il conteggio dei successi seguirà la distribuzione beta-binomiale. Dovremo presumere che non vi siano incertezze nei parametri beta stimati, e .p α β
Ci sono tre domande:
1) Uno teorico: va bene usare solo le stime puntuali dei parametri beta? So che per costruire un CI per l'osservazione futura nella regressione lineare multipla
fanno quel varianza del termine di errore wrt, . Prendo (correggimi se sbaglio) che la giustificazione è che in pratica è stimato con una precisione molto maggiore rispetto ai coefficienti di regressione e non otterremo molto cercando di incorporare l'incertezza di . Una giustificazione simile è applicabile ai parametri beta stimati, e ?σ 2 σ 2 α β
2) Quale pacchetto è meglio (R: gamlss-bb, betareg, aod ?; Ho anche accesso a SAS).
3) Dati i parametri beta stimati, esiste una scorciatoia (approssimativa) per ottenere i quantili (2,5%, 97,5%) per il conteggio dei successi futuri o, meglio ancora, per la proporzione di successi futuri nella distribuzione beta-binomiale.