Interpretazione dei grafici diagnostici residui per i modelli glm?


33

Sto cercando linee guida su come interpretare i grafici residui dei modelli glm. Soprattutto modelli poisson, binomiali negativi, binomiali. Cosa possiamo aspettarci da questi grafici quando i modelli sono "corretti"? (ad esempio, prevediamo che la varianza aumenti all'aumentare del valore previsto, per quando si ha a che fare con un modello di Poisson)

So che le risposte dipendono dai modelli. Eventuali riferimenti (o punti generali da considerare) saranno utili / apprezzati.

Risposte:


16

Penso che questa sia una delle parti più difficili quando si esegue l'analisi di regressione. Faccio fatica anche con la maggior parte delle interpretazioni (in particolare la diagnostica binomiale è pazza!).

Mi sono appena imbattuto in questo post http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ che ha anche collegato http://statmaster.sdu.dk/courses/st111/module04/index.html # SECTION00020000000000000000

ciò che mi aiuta di più è tracciare i residui rispetto a ogni parametro predittivo incluso E non incluso nel modello. Questo significa anche quelli che sono stati lasciati in anticipo per ragioni di multicolinearità. Per questo, i diagrammi a dispersione condizionale e quelli normali sono fantastici. questo aiuta a individuare possibili errori

In "Forest Analytics with R" (UseR Series) ci sono alcune buone spiegazioni su come interpretare i residui per modelli di effetti misti (e anche glms). Buona lettura! http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8

Un giorno ho pensato a un sito web che potesse raccogliere schemi residui che gli utenti possono votare per essere "ok" e "non ok". ma non ho mai trovato quel sito Web;)


8

Vorrei suggerire i metodi descritti in:

 Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne,
 D.F and Wickham, H. (2009) Statistical Inference for exploratory
 data analysis and model diagnostics Phil. Trans. R. Soc. A 2009
 367, 4361-4383 doi: 10.1098/rsta.2009.0120

Ci sono alcune idee diverse, ma si basano principalmente sulla simulazione di dati in cui sai qual è la vera relazione e quella relazione si basa sull'analisi dei dati reali. Quindi si confronta la diagnostica dai dati reali con la diagnostica dei set di dati simulati. La vis.testfunzione nel pacchetto TeachingDemos per R implementa una variazione di 1 dei suggerimenti nel documento. Leggi l'intero documento (non solo il mio breve riassunto) per una migliore comprensione.


Penso che sia un ottimo suggerimento per vedere schemi che si discostano da casuali in dispersioni o altri grafici, ma non è l'unico obiettivo quando si visualizzano i residui. Spesso siamo interessati a particolari deviazioni dal casuale (ad es. Etereoscedasticità, non linearità errata nel modello, variabili omesse, valori anomali o valori di leva elevati, ecc.). Il confronto con i dati generati casualmente non aiuta in alcun modo a identificare perché i residui non sono casuali né il rimedio.
Andy W,

@AndyW, penso che stiamo interpretando la domanda originale in modo diverso. La mia risposta avvia il ricercatore facendogli sapere se c'è qualcosa in più che devono cercare o se la trama residua è ragionevole. Cosa fare se non sembra ragionevole è quindi il passaggio successivo e oltre la mia risposta (anche se alcune ipotesi aggiuntive potrebbero essere confrontate utilizzando una nuova serie di simulazioni).
Greg Snow,

5

Questa domanda è piuttosto vecchia, ma ho pensato che sarebbe utile aggiungere che, da poco, è possibile utilizzare il pacchetto DHARMa R per trasformare i residui di qualsiasi GL (M) M in uno spazio standardizzato. Una volta fatto ciò, è possibile valutare / testare visivamente problemi residui come deviazioni dalla distribuzione, dipendenza residua da un predittore, eteroschedasticità o autocorrelazione in modo normale. Vedi la vignetta del pacchetto per esempi elaborati, anche altre domande sul CV qui e qui .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.