Nel modello , potremmo stimare usando l'equazione normale :
Il vettore dei residui è stimato da
dove
La mia domanda è come ottenere la conclusione di
Nel modello , potremmo stimare usando l'equazione normale :
Il vettore dei residui è stimato da
dove
La mia domanda è come ottenere la conclusione di
Risposte:
La conclusione conta semplicemente le dimensioni degli spazi vettoriali. Tuttavia, non è generalmente vero.
Le proprietà più elementari della moltiplicazione della matrice mostrano che la trasformazione lineare rappresentata dalla matrice soddisfa
esibendolo come un operatore di proiezione . Pertanto il suo complemento
(come indicato nella domanda) è anche un operatore di proiezione. La traccia di è il suo rango h (vedi sotto), da cui la traccia di Q è uguale a n .
Dalla sua stessa formula è evidente che è la matrice associata alla composizione di due trasformazioni lineari J = ( X ′ X ) - X ′ e X stessa. Il primo ( J ) trasforma il n -vettore y in p -vettore β . Il secondo ( X ) è una trasformazione da R p a R n in y = X
se e solo se J è di rango massimo; e in generale n ≥ tr ( Q ) ≥ n - p . Nel primo caso si dice che il modello è "identificabile" (per i coefficienti di β ).
sarà al massimo se e solo se X ′ X è invertibile.
rappresenta la proiezione ortogonale da n -vettori y (che rappresentano la "risposta" o "variabile dipendente") sullo spazio attraversato dalle colonne di X (che rappresentano le "variabili indipendenti" o "covariate"). La differenza Q = 1 - H mostra come scomporre qualsiasi n -vettore y in una somma di vettori y = H ( y ) + Q ( y ) , dove il primo può essere "previsto" da X
Un operatore di proiezione su uno spazio vettoriale (come R n ) è una trasformazione lineare P : V → V (cioè, un endomorfismo di V ) tale che P 2 = P . Questo rende il suo complemento Q = 1 - P anche un operatore di proiezione, perché
Tutte le proiezioni fissano ogni elemento delle loro immagini, poiché ogni volta che possiamo scrivere v = P ( w ) per alcuni w ∈ V , da cui w = P ( v ) = P 2 ( v ) = P ( P ( v ) ) = P ( w ) .
Associati a qualsiasi endomorfismo di V sono due sottospazi: il suo kernel ker ( P ) = { v e la suaimmagine Im ( P ) = { v
La traccia di è uguale alla traccia di 1 (pari a n , la dimensione di V ) meno la traccia di P .
Questi risultati possono essere riassunti con l'affermazione che la traccia di una proiezione è uguale al suo rango.
@Dougal ha già dato una risposta, ma eccone un'altra, un po 'più semplice.
Innanzitutto, usiamo il fatto che . Quindi, otteniamo: t r ( Q ) = t r ( I ) - t r ( X ( X ′ X ) - 1 X ′ ) . Ora sono una matrice di identità n × n , quindi t
Supponiamo che e che X sia al livello massimo.
Considera la decomposizione compatta del valore singolare , dove Σ ∈ R p × p è diagonale e U ∈ R n × p , V ∈ R p × p hanno U T U = V T V = V V T = I p (ma nota che U U T è al massimo p quindi non può essere I n). Poi
è unitario. Possiamo scrivere