Perché errori non distribuiti normalmente compromettono la validità delle nostre dichiarazioni di significatività?


10

C'è un presupposto di normalità quando si tratta di considerare i modelli OLS e cioè che gli errori devono essere normalmente distribuiti. Ho navigato in Cross Validated e sembra che Y e X non debbano essere normali affinché gli errori siano normali. La mia domanda è: perché quando abbiamo errori non normalmente distribuiti, la validità delle nostre dichiarazioni di significato è compromessa? Perché gli intervalli di confidenza saranno troppo ampi o stretti?

Risposte:


9

perché quando abbiamo errori non normalmente distribuiti viene compromessa la validità delle nostre dichiarazioni di significatività? Perché gli intervalli di confidenza saranno troppo ampi o stretti?

Gli intervalli di confidenza si basano sul modo in cui il numeratore e il denominatore sono distribuiti in una statistica t.

Con dati normali il numeratore di una statistica t ha una distribuzione normale e la distribuzione del quadrato del denominatore (che è quindi una varianza) è un particolare multiplo di una distribuzione chi-quadrata. Quando anche il numeratore e il denominatore sono indipendenti (come nel caso dei dati normali, dato che le osservazioni stesse sono indipendenti), l'intera statistica ha una distribuzione t.

β^-βSβ^βt

Se i dati provenissero da un'altra distribuzione, la statistica non avrebbe una distribuzione t. Ad esempio, se avesse una coda pesante, la distribuzione a t tenderebbe ad essere un po 'più leggera (le osservazioni esterne influiscono sul denominatore più che sul numeratore). Ecco un esempio In entrambi i casi, l'istogramma è per 10.000 regressioni:

inserisci qui la descrizione dell'immagine

β=0(-2,2)

Un intervallo t del 95% (che dovrebbe includere il 95% delle pendenze nel nostro campione) va da -2.048 a 2.048. Per i dati normali, in realtà includeva il 95,15% delle pendenze del campione 10000. Per i dati distorti include il 99,91%.


Quale distribuzione hai usato per la versione inclinata e dalla coda pesante?
gung - Ripristina Monica

2
t
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.