Come può un vettore di variabili rappresentare un iperpiano?


12

Sto leggendo Elements of Statistical Learning e a pagina 12 (sezione 2.3) un modello lineare è indicato come:

Y^=XTβ^

... dove è la trasposizione di un vettore di colonna dei predittori / variabili / input indipendenti. (Indica in precedenza "si presume che tutti i vettori siano vettori di colonna", quindi questo non renderebbe un vettore di riga e un vettore di colonna?) X T βXTXTβ^

In è incluso un " " da moltiplicare per il coefficiente corrispondente dando l'intercetta (costante).1X1

Continua dicendo:

Nello spazio di input-output -dimensionale, rappresenta un iperpiano. Se la costante è inclusa in , l'iperpiano include l'origine ed è un sottospazio; in caso contrario, è un insieme affine che taglia l' asse nel punto .( X , Y ) X Y ( 0 , ^ β 0 )(p+1)(X, Y^)XY(0, β0^)

" " descrive un vettore formato dalla concatenazione dei predittori, l'intercetta " " e ? E perché includere un " " in di passare attraverso l'origine, sicuramente " " deve essere moltiplicato per ?1 Y 1 X 1 ^ β 0(X, Y^)1Y^1X1β0^

Non riesco a capire il libro; qualsiasi aiuto / consiglio / link alle risorse sarebbe molto apprezzato.


4
Potrebbe essere utile considerare prima . In tal caso, , con l'intercetta. Questa è l'equazione di una linea che passa . Le estensioni a dimensioni superiori sono immediate. y = β 0 + x β β 0 ( 0 , p 0 )p=1y^=β^0+xβ^β0(0,β^0)
Ocram,

Se l'aiuto di @ocram non è abbastanza, prova a scrivere i vettori e a moltiplicare.
Peter Flom

2
Ecco una bella presentazione grafica: blog.stata.com/2011/03/03/… . La notazione è diversa, A c'è la tua X e x è . β^
Dimitriy V. Masterov

2
Il libro è sbagliato, o almeno è incoerente. Evidentemente ci sono variabili che non includono la costante. Quindi l'insieme è effettivamente un iperpiano, ma non è corretto affermare che la costante sia "inclusa in ". Invece penso che il libro voluto dire la costante è incluso nella regressione , ma ancora non deve essere considerato parte di . Pertanto, il modello dovrebbe davvero essere scritto dove . L'impostazione di fornisce immediatamente l'asserzione sull'intercettazione. { ( X , Y ) | X R p } X X Y = β 0 + X ' β β = ( β 1 , ß 2 , ... , β p ) ' X = 0p{(X,Y^)|XRp}XXY^=β^0+Xβ^β=(β1,β2,,βp)X=0
whuber

1
(Se invece includiamo la costante in , allora non possiamo lasciare che vari liberamente su tutto : è costretto a trovarsi in un sottospazio tridimensionale . Il grafico ha quindi la dimensione minima di e quindi non è in realtà un "hyperplane".)X R p p - 1 { ( X , Y ) } 2XXRpp1{(X,Y^)}2
whuber

Risposte:


4

Sia il numero di osservazioni e il numero di variabili esplicative.KNK

NX è in realtà una matriceSolo quando guardiamo una singola osservazione, denotiamo ogni osservazione solitamente come - un vettore di riga di variabili esplicative di un particolare scalare di osservazione moltiplicato per il vettore di colonna . Inoltre, è un vettore di colonna , contenente tutte le osservazioni .x T i KN×KxiTβ Y NK×1βYY nN×1Yn

X X NYXXN×KXYYX

YXKXK+1

X1β1β1Yx1i iperpiano 1- dimensionale è ridotto di una dimensione in unsottospazio K -dimensionale, e β 1 corrisponde all'intercetta di questopiano K- dimensionale.K+1Kβ1K

yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2

<Y,X>

x11

yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0

<0,β1><0,0>β

(XX)β=Xy(XX)βXy=0X(yXβ)=0.
XyXβ=0

( Modifica: mi sono appena reso conto che per la tua seconda domanda questo è esattamente il contrario di te che hai scritto riguadagnando l'inclusione o l'esclusione della costante. Tuttavia, ho già escogitato la soluzione qui e mi correggo se sbaglio su quella. )

So che la rappresentazione matriciale di una regressione può essere alquanto confusa all'inizio, ma alla fine semplifica molto quando deriva un'algebra più complessa. Spero che questo aiuti un po '.


1

Penso che il modo di pensarci sia di riorganizzare quell'equazione:

Y^XTβ^=0

Y^
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.