Modelli misti lineari generalizzati: diagnostica


11

Ho una regressione logistica di intercettazione casuale (dovuta a misurazioni ripetute) e vorrei fare un po 'di diagnostica, in particolare riguardo a valori anomali e osservazioni influenti.

Ho guardato i residui per vedere se ci sono osservazioni che si distinguono. Ma vorrei anche guardare qualcosa come la distanza di Cook o DFFITS. Hosmer e Lemeshow (2000) affermano che a causa della mancanza di strumenti diagnostici modello per dati correlati, si dovrebbe semplicemente adattarsi a un modello di regressione logistica regolare ignorando la correlazione e utilizzare gli strumenti diagnostici disponibili per la regressione logistica regolare. Sostengono che ciò sarebbe meglio che non fare alcuna diagnostica.

Il libro è del 2000 e mi chiedo se ora ci sono metodi disponibili per la diagnostica dei modelli con regressione logistica a effetti misti? Quale sarebbe un buon approccio per verificare i valori anomali?

Modifica (5 novembre 2013):

A causa della mancanza di risposte, mi chiedo se fare la diagnostica con modelli misti non sia fatto in generale o piuttosto non sia un passo importante nella modellazione dei dati. Vorrei quindi riformulare la mia domanda: cosa fai una volta trovato un "buon" modello di regressione?


Possibile duplicato di una domanda recente simile che non ha ricevuto così tanta attenzione: stats.stackexchange.com/q/70783/442
Henrik

Potresti trovare utile la mia risposta a una domanda simile.
Randel,

Risposte:


2

I metodi diagnostici sono infatti diversi per i modelli misti lineari generalizzati. Uno ragionevole che ho visto basato su residui di un GLMM è dovuto a Pan e Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x). Hanno usato somme cumulative di residui in cui l'ordinamento è imposto dalle variabili esplicative o dal predittore lineare, testando così la specifica della forma funzionale di un dato predittore o la funzione di collegamento nel suo insieme. Le distribuzioni null si basano su simulazioni dallo spazio di progettazione sulla distribuzione null di specifiche corrette e hanno dimostrato proprietà e dimensioni decenti di questo test. Non hanno discusso in modo specifico dei valori erratici, ma posso immaginare che i valori anomali debbano probabilmente eliminare almeno la funzione di collegamento curvandola troppo verso l'osservazione influente.


0

Esistono molte opinioni diverse su quale sia il modo migliore di esaminare la diagnostica per i modelli misti. In generale, vorrai esaminare sia i residui sia gli aspetti standard che verrebbero esaminati per un modello di misure non ripetute.

Oltre a questi, in genere, vorrai anche guardare gli effetti casuali stessi. I metodi spesso implicano la rappresentazione degli effetti casuali da parte di varie covariate e la ricerca di non-normalità nella distribuzione degli effetti casuali. Esistono molti altri metodi (alcuni citati nei commenti precedenti), ma di solito è un buon inizio.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.