Sto esaminando alcuni problemi, e in alcuni, per testare i coefficienti, a volte vedo persone che usano la distribuzione di Student, e a volte vedo distribuzione normale. Qual è la regola?
Sto esaminando alcuni problemi, e in alcuni, per testare i coefficienti, a volte vedo persone che usano la distribuzione di Student, e a volte vedo distribuzione normale. Qual è la regola?
Risposte:
La distribuzione normale è la grande distribuzione del campione in molti problemi statistici significativi che coinvolgono alcune versioni del Teorema del limite centrale: hai (approssimativamente) informazioni indipendenti che vengono aggiunte per arrivare alla risposta. Se le stime dei parametri sono asintoticamente normali, anche le loro funzioni saranno asintoticamente normali (in casi regolari).
D'altra parte, la distribuzione di Student è derivata in condizioni più restrittive di normali errori di regressione. Se è possibile acquistare questo presupposto, è possibile acquistare la distribuzione utilizzata per verificare l'ipotesi nella regressione lineare. L'uso di questa distribuzione fornisce intervalli di confidenza più ampi rispetto all'uso della distribuzione normale. Il significato sostanziale di ciò è che in piccoli campioni, è necessario stimare la misura dell'incertezza, l'errore medio quadratico di regressione o la deviazione standard dei residui, . (In campioni di grandi dimensioni, hai un po 'di informazioni come se le conoscessi, quindi la distribuzione degenera alla distribuzione normale.)t σ t
Ci sono alcune occasioni di regressione lineare, anche con campioni finiti, in cui la distribuzione degli studenti non può essere giustificata. Sono collegati a violazioni delle condizioni del secondo ordine relative a errori di regressione; vale a dire che sono (1) varianza costante e (2) indipendente. Se queste ipotesi vengono violate e si correggono gli errori standard utilizzando lo stimatore Eicker / White per i residui eteroschedastici, ma indipendenti; o lo stimatore di Newey-West per errori serialmente correlati o errori standard clusterper i dati correlati al cluster, non è possibile ottenere una giustificazione ragionevole per la distribuzione degli studenti. Tuttavia, impiegando una versione appropriata dell'argomento della normalità asintotica (matrici traingolari e simili), è possibile giustificare l'approssimazione normale (anche se è necessario tenere presente che gli intervalli di confidenza sarebbero molto probabilmente troppo stretti).
Mi piace la rappresentazione della distribuzione student t come una miscela di una distribuzione normale e una distribuzione gamma:
Si noti che la media della distribuzione gamma è e la varianza di questa distribuzione è . Quindi possiamo vedere la distribuzione t come generalizzare il presupposto di varianza costante a un presupposto di varianza "simile". fondamentalmente controlla quanto simili permettiamo alle varianze di essere. Vedi anche questo come regressione "ponderata casuale", poiché possiamo usare l'integrale sopra come rappresentazione di "variabile nascosta" come segue:V [ ρ | ν ] = 2 ν
Dove e tutte le variabili sono indipendenti. In realtà questa è fondamentalmente solo la definizione della distribuzione t, comeρ i ∼ G a m m a ( ν
Puoi capire perché questo risultato rende la distribuzione t dello studente "robusta" rispetto alla normale perché un grande errore può verificarsi a causa di un grande valore di o a causa di un piccolo valore di . Ora, poiché è comune a tutte le osservazioni, ma è specifico dell'una, la cosa generale di "buon senso" da concludere è che i anomali forniscono prove per piccoli . Inoltre, se dovessi fare una regressione lineare , scoprirai che è il peso per la sua osservazione, supponendo che sia noto .:σ 2 ρ i σ 2 ρ i ρ i μ i = x T i β
Quindi un outlier costituisce la prova per il piccolo che significa che la sua osservazione prende meno peso. Inoltre, un piccolo "outlier" - un'osservazione che è prevista / adattata molto meglio del resto - costituisce una prova per grandi . Quindi a questa osservazione verrà dato più peso nella regressione. Ciò è in linea con ciò che si farebbe in modo intuitivo con un valore anomalo o un buon punto dati.ρ i
Nota che non esiste una "regola" per decidere queste cose, sebbene la mia e altre risposte a questa domanda possano essere utili per trovare alcuni test che puoi fare lungo il percorso della varianza finita (lo studente t è una varianza infinita per gradi di libertà inferiori o uguali a due).