Sto adattando un modello di effetti casuali glmerad alcuni dati aziendali. L'obiettivo è analizzare le prestazioni delle vendite per distributore, tenendo conto delle variazioni regionali. Ho le seguenti variabili:
distcode: ID distributore, con circa 800 livelliregion: ID geografico di livello superiore (nord, sud, est, ovest)zone: geografia di medio livello nidificata all'internoregion, circa 30 livelli in totaleterritory: geografia di basso livello nidificata all'internozone, circa 150 livelli
Ogni distributore opera in un solo territorio. La parte difficile è che si tratta di dati riepilogati, con un punto dati per distributore. Quindi ho 800 punti dati e sto cercando di adattare (almeno) 800 parametri anche se in modo regolare.
Ho montato un modello come segue:
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
Questo funziona senza problemi, anche se stampa una nota:
Il numero di livelli di un fattore di raggruppamento per gli effetti casuali è uguale a n, il numero di osservazioni
È una cosa sensata da fare? Ottengo stime limitate di tutti i coefficienti e anche l'AIC non è irragionevole. Se provo un GLMM poisson con il collegamento di identità, l'AIC è molto peggio, quindi il collegamento di registro è almeno un buon punto di partenza.
Se tracciamo i valori adattati rispetto alla risposta, ottengo ciò che è essenzialmente un adattamento perfetto, il che immagino sia perché ho un punto dati per distributore. È ragionevole o sto facendo qualcosa di completamente stupido?
Questo utilizza i dati per un mese. Posso ottenere dati per più mesi e ottenere qualche replica in quel modo, ma dovrei aggiungere nuovi termini per la variazione da mese a mese e possibili interazioni, giusto?
ETA: Ho eseguito di nuovo il modello sopra, ma senza familyargomenti (quindi solo un LMM gaussiano piuttosto che un GLMM). Ora lmermi ha dato il seguente errore:
Errore in (funzione (fr, FL, start, REML, verbose): il numero di livelli di un fattore di raggruppamento per gli effetti casuali deve essere inferiore al numero di osservazioni
Quindi immagino che non stia facendo qualcosa di sensato, poiché cambiare la famiglia non dovrebbe avere alcun effetto. Ma la domanda ora è: perché ha funzionato in primo luogo?