Perché la regressione polinomiale è considerata un caso speciale di regressione lineare multipla?


38

Se la regressione polinomiale modella relazioni non lineari, come può essere considerato un caso speciale di regressione lineare multipla?

Wikipedia osserva che "Sebbene la regressione polinomiale si adatti a un modello non lineare ai dati, come problema di stima statistica è lineare, nel senso che la funzione di regressione è lineare nei parametri sconosciuti stimati dai dati. "E(y|x)

In che modo la regressione polinomiale è lineare nei parametri sconosciuti se i parametri sono coefficienti per termini con ordine 2?


4
I parametri da stimare sono (multi) lineari. Se si stessero stimando i valori degli esponenti, il problema della stima non sarebbe lineare; ma la quadratura di un predittore risolve l'esponente esattamente a 2.
Sycorax dice Reinstate Monica

La mia comprensione è che il commento di @ user777, così come le risposte di seguito, si applicano non solo alla regressione polinomiale, ma anche a qualsiasi regressione che utilizza una biiezione delle variabili predittive. ad es. qualsiasi funzione reversibile, come , e x , ecc. (più alcune altre funzioni, ovviamente, dal momento che il 2 ° potere non è biiettivo). log(x)ex
naught101

Grazie a tutti; tutte le risposte e i commenti sono stati utili.
Gavinmh

Risposte:


53

Quando si forma un modello di regressione come y i = β 0 + β 1 x i + β 2 x 2 i , il modello e le OLS stimatore non 'sapere' che x 2 i è semplicemente il quadrato x i , 'pensa' che sia un'altra variabile. Naturalmente c'è una certa collinearità, che viene incorporata nell'adattamento (ad esempio, gli errori standard sono più grandi di quanto potrebbero essere altrimenti), ma molte coppie di variabili possono essere in qualche modo collineari senza che una di esse sia una funzione dell'altra. y^i=β^0+β^1xi+β^2xi2xi2xi

Noi non riconosciamo che ci sono davvero due variabili distinte nel modello, perché noi sappiamo che è in definitiva la stessa variabile x i che abbiamo trasformato e incluso al fine di catturare una relazione curvilinea tra x i e y i . Che la conoscenza della vera natura di x 2 i , insieme con la nostra convinzione che ci sia una relazione curvilinea tra x i e y i è ciò che rende difficile per noi capire il modo in cui è ancora lineare dal punto di vista del modello. Inoltre, visualizziamo xxi2xixiyixi2xiyi e x 2 i insieme osservando la proiezione marginale della funzione 3D sul piano 2D x , y . xixi2x,y

Se hai solo e x 2 i , puoi provare a visualizzarli nello spazio 3D completo (anche se è ancora piuttosto difficile vedere davvero cosa sta succedendo). Se osservassi la funzione adattata in tutto lo spazio 3D, vedresti che la funzione adattata è un piano 2D e inoltre che è un piano piatto. Come ho detto, è difficile vedere bene perché i dati x i , x 2 i esistono solo lungo una linea curva che attraversa quello spazio 3D (quel fatto è la manifestazione visiva della loro collinearità). Possiamo provare a farlo qui. Immagina che questo sia il modello montato: xixi2xi,xi2

x     = seq(from=0, to=10, by=.5)
x2    = x**2
y     = 3 + x - .05*x2
d.mat = data.frame(X1=x, X2=x2, Y=y)

# 2D plot
plot(x, y, pch=1, ylim=c(0,11), col="red", 
     main="Marginal projection onto the 2D X,Y plane")
lines(x, y, col="lightblue")

inserisci qui la descrizione dell'immagine

# 3D plot
library(scatterplot3d)
s = scatterplot3d(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, color="gray", pch=1, 
              xlab="X1", ylab="X2", zlab="Y", xlim=c(0, 11), ylim=c(0,101), 
              zlim=c(0, 11), type="h", main="In pseudo-3D space")
s$points(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, col="red", pch=1)
s$plane3d(Intercept=3, x.coef=1, y.coef=-.05, col="lightblue")

inserisci qui la descrizione dell'immagine

Potrebbe essere più facile vedere in queste immagini, che sono schermate di una figura 3D ruotata fatta con gli stessi dati usando il rglpacchetto.

inserisci qui la descrizione dell'immagine

ppp+1


17

y=a+bx+cx2xabcy=i=0Naihi(x)hixhix


14

yi=b0+b1xin1++bpxinp+ϵi.

y=Xb+ϵ;X=(1x1n1x1np1x2n1x2np1xnn1xnnp).
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.