Antefatto: attualmente sono un biostatista alle prese con un set di dati di tassi di espressione cellulare. Lo studio ha esposto una serie di cellule, raccolte in gruppi da vari donatori, a determinati peptidi. Le cellule esprimono determinati biomarcatori in risposta, oppure no. I tassi di risposta vengono quindi registrati per ciascun gruppo di donatori. I tassi di risposta (espressi in percentuale) sono il risultato di interesse e l'esposizione del peptide è il predittore.
Si noti che le osservazioni sono raggruppate all'interno dei donatori.
Dal momento che ho solo i dati di riepilogo, sto trattando i tassi di risposta dei donatori come dati continui (almeno per ora).
La complicazione deriva dal fatto che ho molti zero nei miei dati. Troppi per essere ignorati. Sto prendendo in considerazione un modello gamma a inflazione zero per far fronte al fatto che ho distorto i dati continui associati a una sovrabbondanza di zero. Ho anche considerato il modello di Tobia, ma questo sembra inferiore dal momento che assume la censura a un limite inferiore, al contrario dei veri zero (gli econometrici potrebbero dire che la distinzione è discutibile).
Domanda: in generale, quando è appropriato usare un modello gamma a gonfia zero? Cioè, quali sono i presupposti? E come si interpretano le sue inferenze? Sarei grato per i collegamenti ai documenti che ne discutono, se ne hai.
Ho trovato un collegamento su SAS-L in cui Dale McLerran fornisce il codice NLMIXED per un modello gamma a gonfiaggio zero, quindi sembra possibile. Tuttavia, odierei accusarmi alla cieca.