La regressione beta (ovvero GLM con distribuzione beta e di solito la funzione di collegamento logit) è spesso consigliata per gestire la risposta nota come variabile dipendente che assume valori compresi tra 0 e 1, come frazioni, rapporti o probabilità: regressione per un risultato (rapporto o frazione) tra 0 e 1 .
Tuttavia, si afferma sempre che la regressione beta non può essere utilizzata non appena la variabile di risposta è uguale a 0 o 1 almeno una volta. In tal caso, è necessario utilizzare il modello beta zero / one-inflated o effettuare una trasformazione della risposta, ecc.: Regressione beta dei dati proporzionali inclusi 1 e 0 .
La mia domanda è: quale proprietà della distribuzione beta impedisce alla regressione beta di gestire esattamente 0 e 1, e perché?
Immagino che e non supportino la distribuzione beta. Ma per tutti i parametri di forma e , sia zero che uno sono a supporto della distribuzione beta, è solo per parametri di forma più piccoli che la distribuzione va all'infinito su uno o entrambi i lati. E forse i dati di esempio sono tali che e che si adattano meglio si rivelerebbero entrambi superiori a .
Vuol dire che in alcuni casi si potrebbe effettivamente usare la regressione beta anche con zeri / uno?
Naturalmente anche quando 0 e 1 sono a supporto della distribuzione beta, la probabilità di osservare esattamente 0 o 1 è zero. Ma così è la probabilità di osservare qualsiasi altro insieme di valori numerabili, quindi questo non può essere un problema, vero? (Cfr. Questo commento di @Glen_b).
Nel contesto della regressione beta, la distribuzione beta è parametrizzata in modo diverso, ma con dovrebbe essere ancora ben definita su per tutti i .