Il motivo per cui lo chiedo è perché sembra che i residui internazionalizzati sembrino avere lo stesso modello dei residui stimati grezzi. Sarebbe bello se qualcuno potesse offrire una spiegazione.
Il motivo per cui lo chiedo è perché sembra che i residui internazionalizzati sembrino avere lo stesso modello dei residui stimati grezzi. Sarebbe bello se qualcuno potesse offrire una spiegazione.
Risposte:
Supponi un modello di regressione con matrice di progettazione (una colonna seguita dai tuoi predittori), predizioni (dove è la "matrice del cappello") e i residui . Il modello di regressione presuppone che i veri errori abbiano tutti la stessa varianza (omoschedasticità):X 1 Y = X ( X ' X ) - 1 x ' y = H y H e = y - y ε
La matrice di covarianza dei residui è . Ciò significa che i residui grezzi hanno varianze diverse - la diagonale della matrice . Gli elementi diagonali di sono i valori di cappello .e i σ 2 ( 1 - h i i ) σ 2 ( I - H ) H h i i
I residui veramente standardizzati con varianza 1 sono quindi . Il problema è che la varianza di errore è sconosciuta e i residui studentizzati internamente / esternamente risultano da scelte particolari per un preventivo .σe/( σ √ σ
Poiché si prevede che i residui grezzi siano eteroschedastici anche se sono omoschedastici, i residui grezzi sono teoricamente meno adatti a diagnosticare problemi con l'ipotesi di omoschedasticità rispetto ai residui standardizzati o studentizzati.
Su quali tipi di dati hai eseguito i tuoi test grafici? Quando tutte le ipotesi valgono (o si avvicinano), non mi aspetto una grande differenza tra i residui grezzi e quelli studentizzati, il vantaggio principale è quando ci sono punti altamente influenti. Considera questi dati (simulati) che hanno una tendenza lineare positiva e un outlier altamente influente:
Ecco la trama dei valori adattati rispetto ai residui grezzi:
Si noti che il valore del residuo del nostro punto influente è più vicino a 0 rispetto ai residui minimi e massimi dal resto dei punti (non è nei 3 residui grezzi più estremi).
Ora ecco la trama con i residui standardizzati (internamente studentizzati):
In questo diagramma il residuo standardizzato si distingue perché la sua influenza è stata spiegata.
In questo semplice esempio è facile vedere cosa sta succedendo, ma cosa accadrebbe se avessimo più di una variabile e un punto molto influente, ma non insolito nei grafici bidimensionali? Non sarebbe ovvio da trame di residui grezzi, ma i residui studentizzati mostrerebbero quel residuo come più estremo.