Questa domanda / argomento è emersa in una discussione con un collega e stavo cercando alcune opinioni su questo:
Sto modellando alcuni dati usando una regressione logistica di effetti casuali, più precisamente una regressione logistica di intercettazione casuale. Per gli effetti fissi ho 9 variabili che sono di interesse e vengono prese in considerazione. Vorrei fare una sorta di selezione del modello per trovare le variabili che sono significative e dare il modello "migliore" (solo effetti principali).
La mia prima idea era quella di utilizzare l'AIC per confrontare diversi modelli, ma con 9 variabili non ero troppo eccitante per confrontare 2 ^ 9 = 512 modelli diversi (parola chiave: dragaggio dei dati).
Ne ho discusso con un collega e mi ha detto che ricordava di aver letto sull'uso della selezione di modelli graduale (o in avanti) con i GLMM. Invece di utilizzare un valore p (ad es. Basato su un test del rapporto di verosimiglianza per i GLMM), si dovrebbe usare l'AIC come criterio di entrata / uscita.
Ho trovato questa idea molto interessante, ma non ho trovato riferimenti che ne abbiano ulteriormente discusso e il mio collega non ha ricordato dove l'aveva letta. Molti libri suggeriscono di utilizzare l'AIC per confrontare i modelli, ma non ho trovato alcuna discussione sull'uso di questo insieme a una procedura di selezione del modello graduale o in avanti.
Quindi ho sostanzialmente due domande:
C'è qualcosa di sbagliato nell'utilizzare l'AIC in una procedura di selezione del modello graduale come criterio di entrata / uscita? Se sì, quale sarebbe l'alternativa?
Avete dei riferimenti che discutono la procedura sopra descritta (anche come riferimento per un rapporto finale?
Migliore,
Emilia