Residui grezzi contro residui standardizzati rispetto ai residui studentizzati: cosa usare quando?


31

Questo si presenta come una domanda simile e non ha ottenuto molte risposte.

Omettendo test come Cook's D e osservando i residui come gruppo, sono interessato a come gli altri usano i residui quando valutano la bontà di adattamento. Uso i residui grezzi:

  1. in un diagramma QQ, per valutare la normalità
  2. in un diagramma a dispersione di rispetto ai residui, per il controllo del bulbo oculare di (a) etereoscedasticità e (b) autocorrelazione seriale.y

Per tracciare contro i residui per esaminare i valori di dove possono verificarsi valori anomali, preferisco usare i residui studentizzati . Il motivo della mia preferenza è che consente una facile visualizzazione di quali residui a cui i valori sono problematici, sebbene i residui standardizzati forniscano un risultato estremamente simile. La mia teoria sulla quale si usa è che dipende da quale università si è frequentato.yyy

È simile a come gli altri usano i residui? Altri usano questo numero di grafici in combinazione con statistiche riassuntive?


3
I residui studentizzati sono senza dubbio migliori nel rilevare valori anomali e, forse, un po 'meglio nell'ispezione dell'eteroscedasticità. Per altri scopi, non fa differenza per me quali residui usare.
ttnphns,

Per attirare l'attenzione su una domanda, Michelle, o per chiedere una modifica del suo stato (come CW), segui il link "flag" sotto la domanda. Questo avviserà automaticamente tutti i moderatori. Incorporare richieste in domande, commenti o risposte è incostante perché fa affidamento sulla speranza che un moderatore (o un altro utente ad alta reputazione) lo leggerà entro un tempo ragionevole!
whuber

@whuber Ah, vedi ho pensato che uno di voi alla fine l'avrebbe letto. :) Grazie per il suggerimento sull'uso delle bandiere.
Michelle,

1
Ciao @ttnphns Perché dovrebbero essere migliori? In particolare, perché lo studente dovrebbe essere migliore di quello standardizzato? (Non ho mai saputo davvero la risposta qui)
Peter Flom - Reinstalla Monica

4
@Peter, i residui studentizzati sono meno "distorti" dall'algo adattamento OLS e sono più vicini alla nozione teorica di "errori" . Possono essere confrontati direttamente in diverse regioni della linea di adattamento, quindi sono meglio in decisione se un punto è un valore anomalo.
ttnphns,

Risposte:


8

Questa non è tanto una risposta quanto un chiarimento sulla terminologia. La tua domanda riguarda i residui grezzi, standardizzati e studentizzati. Tuttavia, questa non è la terminologia usata dalla maggior parte degli statistici, anche se noto che le note della tua classe lo affermano.

Raw: come ce l'hai.

Standardizzato: in realtà si tratta dei residui grezzi divisi per la vera deviazione standard dei residui. Poiché la vera deviazione standard è raramente nota, un residuo standardizzato non viene quasi mai utilizzato.

Studentizzato internamente: poiché la vera deviazione standard dei residui non è in genere nota, viene invece utilizzata la deviazione standard stimata. Questo è un residuo internamente studiato, ed è quello che hai chiamato standardizzato.

Studentato esternamente: lo stesso del residuo studentizzato internamente, tranne per il fatto che la stima della deviazione standard dei residui viene calcolata da una regressione tralasciando l'osservazione in questione.

Pearson: il residuo grezzo diviso per la deviazione standard della variabile di risposta (la variabile y) piuttosto che dei residui. Non hai questo elencato.

"trarne uno": non ha un nome formale, ma è lo stesso delle note di classe.

standardizzato "lasciane uno fuori": inoltre non ha un nome formale, ma questo non è ciò che le note di classe chiamano studentized.

fonti:

  1. lo stesso link wiki che hai sui residui studentizzati ("un residuo studentizzato è il quoziente risultante dalla divisione di un residuo mediante una stima della sua deviazione standard")

  2. documentazione per il calcolo residuo in SAS


2
+1 Certamente alcuni statistici hanno usato i termini nella domanda del PO (e non sempre perfettamente coerentemente con gli altri usando le stesse parole). Penso che i termini che usi stiano diventando più comuni ma non sono sicuro su quali basi potremmo indovinare il loro uso relativamente globale tra gli statistici - i documenti, ad esempio, non aiutano necessariamente perché lo statistico medio non sarà attivamente la pubblicazione. Forse hai ragione, ma come lo sapremmo? [Se ti capita di modificare di nuovo, potresti voler sostituire "standardizzato" verso la fine con "standardizzato".]
Glen_b -Reinstate Monica

2

Ri: trame,

Esiste un eccesso di adattamento, ma la sovrastampa non può davvero fare molto male, soprattutto in fase di diagnostica. Un diagramma di probabilità normale standardizzato non può ferire accanto al diagramma di QQ. Trovo che sia meglio valutare il centro della distribuzione.

Ri: residui,

Gestisco residui sia standardizzati che studentizzati in fase di bozza e di solito finisco per codificare quelli standardizzati. Non so che cosa effettivamente eseguono le altre persone, perché la diagnostica è davvero codificata nel materiale di replica che trovo online.

Ri: diagnostica,

vifhettestR2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.