Perché diciamo "Errore standard residuo"?


14

Un errore standard è la deviazione standard stimata di uno stimatore per un parametro . θ θσ^(θ^)θ^θ

Perché la deviazione standard stimata dei residui è chiamata "errore standard residuo" (ad es. Nell'output della summary.lmfunzione di R ) e non "deviazione standard residua"? Quale stima di parametro forniamo qui un errore standard?

Consideriamo ogni residuo come uno stimatore del "suo" termine di errore e stimiamo l'errore standard "aggregato" di tutti questi stimatori?


6
Penso che sia una cosa R. Non credo che altri software utilizzino necessariamente il fraseggio e la "deviazione standard residua" sia comune nei libri di testo, ad es. Non ho una risposta, ma ho sempre pensato che fosse strano che R usasse quella frase.
gung - Ripristina Monica

@gung: questa potrebbe essere la spiegazione! Quando google "errore standard residuo" tra virgolette ottengo solo lo 0,1% dei risultati che senza virgolette ...
Michael M

Potrei metterlo come una (non) risposta, se preferisci.
gung - Ripristina Monica

1
@gung è divertente come l'utilizzo di un software specifico dia forma al tuo pensiero: non lo definirei mai "residuo sd" - i residui non sono dati ma errori, quindi l'errore residuo sembra essere il nome proprio. Ma se ci pensate sembra davvero una cosa R.
Tim

2
@Tim, potrebbe essere correttamente considerata una stima della deviazione standard degli errori , ma i residui non sono tecnicamente gli errori stessi. Né è l'errore standard dell'errore SD, per quello che vale.
gung - Ripristina Monica

Risposte:


12

Penso che il fraseggio sia specifico summary.lm()dell'output di R. Si noti che il valore sottostante è in realtà chiamato "sigma" ( summary.lm()$sigma). Non credo che altri software utilizzino necessariamente quel nome per la deviazione standard dei residui. Inoltre, l'espressione "deviazione standard residua" è comune nei libri di testo, ad esempio. Non so come sia diventato il fraseggio usato summary.lm()nell'output di R , ma ho sempre pensato che fosse strano.


In cosa summary.lm(reg)$sigmadifferisce da sd(reg$residuals)?
attacco aereo

3
@ AndréTerra, il giusto grado di libertà è n - p, che è quello che usa il sommario. sd usa var che usa n - 1 gradi di libertà. Se si calcola manualmente la deviazione standard dei residui che si dividono per n - p, si otterrà la stessa risposta fornita dal riepilogo.
Jdub,

3
Per confermare il gung, cito dalla documentazione R di stats::sigma: Il termine errato "Errore standard residuo" ha fatto parte di troppi output R (e S) per poter essere facilmente modificato lì.
NRH,

2

Dalla mia formazione in econometria, si chiama "errore standard residuo" perché è una stima dell'effettiva "deviazione standard residua". Vedi questa domanda correlata che conferma questa terminologia.

Una ricerca su Google per il termine errore standard residuo mostra anche molti risultati, quindi non è affatto una stranezza. Ho provato entrambi i termini con le virgolette ed entrambi vengono visualizzati circa 60.000 volte.


Interessante. Ma perché definirebbe una stima di una deviazione standard di qualsiasi variabile casuale (come un termine di errore e non uno stimatore specifico) un "errore standard"?
Michael M,

Il mio pensiero è che dobbiamo avere un nome per la stima (per distinguere dal valore reale), qualsiasi nome è buono come un altro. Ma sicuramente qualcuno più informato sull'etimologia può offrire una ragione migliore. Si noti che esiste sicuramente un parallelo con l'errore standard del coefficiente, che è la stima della deviazione standard della stima del coefficiente.
Heisenberg,

0

In parole povere, l'errore standard del campione è una stima della distanza della media del campione dalla media della popolazione, mentre la deviazione standard del campione è il grado in cui gli individui all'interno del campione differiscono dalla media del campione.

Errore standard - Wikipedia, l'enciclopedia libera


6
Questo è vero, ma in realtà non risponde alla domanda. Ciò che R chiama "errore standard residuo" non è "una stima di quanto è probabile che la media del campione si trovi dalla media della popolazione".
gung - Ripristina Monica

0

Un modello di regressione adattato utilizza i parametri per generare previsioni di stima puntuale che sono il mezzo di risposte osservate se si dovesse replicare lo studio con gli stessi valori XX un numero infinito di volte ( quando il modello lineare è vero ).

La differenza tra questi valori previsti e quelli utilizzati per adattarsi al modello sono chiamati " Residui " che, durante la replica del processo di raccolta dei dati, hanno proprietà di variabili casuali con 0 medie. I residui osservati vengono quindi utilizzati per stimare successivamente la variabilità di questi valori e per stimare la distribuzione campionaria dei parametri.

Nota:

Quando l'errore standard residuo è esattamente 0, il modello si adatta perfettamente ai dati (probabilmente a causa di un overfitting).

Se l'errore standard residuo non può essere dimostrato essere significativamente diverso dalla variabilità nella risposta incondizionata, allora ci sono poche prove che suggeriscono che il modello lineare abbia qualche capacità predittiva.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.