Risposte:
Perché la diagnostica si basa sui residui?
Perché molte delle ipotesi si riferiscono alla distribuzione condizionale di , non alla sua distribuzione incondizionata. Ciò equivale a un'ipotesi sugli errori, che stimiamo dai residui.
Nella regressione lineare semplice si vuole spesso verificare se alcune assunzioni sono soddisfatte per poter fare l'inferenza (ad esempio i residui sono normalmente distribuiti).
L'ipotesi di normalità effettiva non riguarda i residui ma il termine di errore. La cosa più vicina a quelle che hai sono i residui, motivo per cui li controlliamo.
È ragionevole verificare le ipotesi verificando che i valori adattati siano normalmente distribuiti?
No. La distribuzione dei valori adattati dipende dal modello delle . Non ti dice molto delle ipotesi.
Ad esempio, ho appena eseguito una regressione su dati simulati, per i quali tutte le ipotesi sono state specificate correttamente. Ad esempio, la normalità degli errori è stata soddisfatta. Ecco cosa succede quando proviamo a verificare la normalità dei valori adattati:
Quali sono i presupposti, come li controlliamo e quando dobbiamo farli?
Indipendenza / indipendenza condizionale degli errori. È possibile verificare forme particolari di dipendenza (ad es. Correlazione seriale). Se non riesci ad anticipare la forma della dipendenza, è un po 'difficile da controllare.
(In realtà ci sono alcune altre ipotesi che non ho menzionato, come errori additivi, che gli errori hanno media zero e così via.)
Se sei interessato solo a stimare l'adattamento della linea dei minimi quadrati e non a dire errori standard, non è necessario formulare la maggior parte di questi presupposti. Ad esempio, la distribuzione degli errori influisce sull'inferenza (test e intervalli) e può influire sull'efficienza della stima, ma la linea LS è comunque la migliore imparziale lineare; quindi a meno che la distribuzione non sia così gravemente non normale che tutti gli stimatori lineari siano cattivi, non è necessariamente un grosso problema se le ipotesi sul termine di errore non valgono.