Cosa calcola effettivamente la formula y ~ x + 0 in R?


Risposte:


18

L'aggiunta +0(o -1) a una formula del modello (ad es., In lm()) in R elimina l'intercetta. Questa è generalmente considerata una brutta cosa da fare; vedere:

La pendenza stimata viene calcolata in modo diverso in base alla stima dell'intercettazione, vale a dire:

(with intercept)β^1=xiyi(xi)(yi)Nxi2(xi)2N(without intercept)β^1=xiyixi2

Poiché la quantità da sottrarre (il "subtrahend") sia nel numeratore che nel denominatore non è necessariamente , la stima della pendenza viene distorta quando l'intercettazione viene soppressa. 0

Anche il valore per viene calcolato in modo diverso; vedere: R2

Ecco le formule sottostanti:

(with intercept)R2=1(yiy^i)2(yiy¯)2(without intercept)R2=1(yiy^i)2yi2

Grazie Gung! Se sopprimo l'Intercettazione, il mio R-quadrato multiplo migliora improvvisamente. Potete aiutarmi qui?
JimBoy,

6
Non esiste un modo concordato per calcolare r al quadrato senza intercettazione. Il quadrato r non ha la sua solita interpretazione. Fare regressione senza intercettazione è quasi sempre una
MOLTA



5

Dipende dal contesto (ovviamente), nel lm(...)comando in R sopprimerà l'intercettazione. Cioè, fai la regressione attraverso l'origine.

Nota che la maggior parte dei libri di testo sull'argomento della regressione ti dirà che forzare l'intercettazione (a qualsiasi valore) è una cattiva idea.

L'interpretazione di x non cambia, ma il valore (confrontandolo con e senza un'intercettazione) cambierà, a volte in modo molto significativo.


Grazie, Repmat! Ottengo stime molto diverse se sopprimo l'intercettazione rispetto a quando non lo faccio. Inoltre, tutti i test t diventano estremamente significativi. Sai perché questo è?
JimBoy,

2
L'intercettazione assorbirà qualsiasi variabile diversa da 0 non contenuta nel modello. Senza l'intercettazione, la varianza deve andare da qualche parte. Questo è il motivo per cui la maggior parte dei libri, come regola generale, afferma che la regressione senza intercettazione è sempre sbagliata. Cioè, OLS è sempre distorto e coerente in questo caso (con alcune eccezioni).
Repmat,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.