abbiamo
ddβ(y−Xβ)′(y−Xβ)=−2X′(y−Xβ) .
Può essere mostrato scrivendo l'equazione esplicitamente con i componenti. Ad esempio, scrivi invece di . Quindi prendi i derivati rispetto a , , ..., e impila tutto per ottenere la risposta. Per un'illustrazione semplice e veloce, puoi iniziare con . β β 1 β 2 β p p = 2(β1,…,βp)′ββ1β2βpp=2
Con l'esperienza si sviluppano regole generali, alcune delle quali sono riportate, ad esempio, in quel documento .
Modifica per guidare per la parte aggiunta della domanda
Con , abbiamop=2
(y−Xβ)′(y−Xβ)=(y1−x11β1−x12β2)2+(y2−x21β1−x22β2)2
La derivata rispetto a èβ1
−2x11(y1−x11β1−x12β2)−2x21(y2−x21β1−x22β2)
Allo stesso modo, la derivata rispetto a èβ2
−2x12(y1−x11β1−x12β2)−2x22(y2−x21β1−x22β2)
Quindi, la derivata rispetto a èβ=(β1,β2)′
(−2x11(y1−x11β1−x12β2)−2x21(y2−x21β1−x22β2)−2x12(y1−x11β1−x12β2)−2x22(y2−x21β1−x22β2))
Ora, osserva che puoi riscrivere l'ultima espressione come
−2(x11x12x21x22)(y1−x11β1−x12β2y2−x21β1−x22β2)=−2X′(y−Xβ)
Certo, tutto è fatto allo stesso modo per un più grande .p
smallmatrix, quindi non ha provato a modificare, poiché la solita soluzione di rompere la formula in più righe non avrebbe funzionato qui.