Tre punti sulla regressione di Poisson vs Normal, tutti relativi alle specifiche del modello:
Effetto dei cambiamenti nei predittori
Con un predittore continuo come il punteggio del test matematico La regressione di Poisson (con il solito link di registro) implica che una variazione unitaria nel predittore porta a una variazione percentuale del numero di premi, vale a dire 10 punti in più nel test matematico sono associati, ad esempio, al 25 percento più premi. Ciò dipende dal numero di premi che lo studente ha già previsto di avere. Al contrario, la regressione normale associa 10 punti in più a un importo fisso, diciamo 3 premi in più in ogni circostanza. Dovresti essere soddisfatto di tale presupposto prima di utilizzare il modello che lo rende. (prima penso che sia molto ragionevole, modulo il prossimo punto.)
Trattare con studenti senza premi
A meno che non ci siano davvero molti premi distribuiti su molti studenti, il tuo numero di premi sarà per lo più piuttosto basso. In effetti predirei l'inflazione zero, cioè la maggior parte degli studenti non ottiene alcun premio, quindi molti zeri e alcuni bravi studenti ottengono un bel po 'di premi. Ciò si confonde con le ipotesi del modello di Poisson ed è almeno altrettanto negativo per il modello normale.
Se si dispone di una discreta quantità di dati, un modello "gonfiato a zero" o "ostacolo" sarebbe naturale. Si tratta di due modelli legati insieme: uno per prevedere se lo studente ottiene dei premi e un altro per prevedere quanti ne ottiene se ne ottiene uno (di solito una qualche forma di modello di Poisson). Mi aspetterei che tutta l'azione fosse nel primo modello.
Esclusività del premio
Infine, un piccolo punto sui premi. Se i premi sono esclusivi, ovvero se uno studente ottiene il premio, nessun altro studente può ottenere il premio, quindi i risultati vengono accoppiati; un conteggio per studente a spinge verso il basso il possibile conteggio di ogni altro. Se vale la pena preoccuparsi dipende dalla struttura dei premi e dalle dimensioni della popolazione studentesca. Lo ignorerei al primo passaggio.
In conclusione, Poisson domina comodamente Normale tranne che per conteggi molto grandi, ma controlla le ipotesi del Poisson prima di appoggiarti su di esso per un'inferenza e, se necessario, preparati a passare a una classe di modello leggermente più complessa.