Sto cercando di capire il concetto di sovradispersione nella regressione logistica. Ho letto che la sovraispersione è quando la varianza osservata di una variabile di risposta è maggiore di quanto ci si aspetterebbe dalla distribuzione binomiale.
Ma se una variabile binomiale può avere solo due valori (1/0), come può avere una media e una varianza?
Sto bene nel calcolare la media e la varianza dei successi da x numero di prove di Bernoulli. Ma non posso avvolgere la testa attorno al concetto di media e varianza di una variabile che può avere solo due valori.
Qualcuno può fornire una panoramica intuitiva di:
- Il concetto di media e varianza in una variabile che può avere solo due valori
- Il concetto di sovradispersione in una variabile che può avere solo due valori