Perché la quadratura di


12

Questa potrebbe essere una domanda di base, ma mi chiedevo perché un valore in un modello di regressione può essere semplicemente quadrato per dare una figura di varianza spiegata?R

Capisco che il coefficiente può dare la forza di una relazione, ma non capisco come la semplice quadratura di questo valore dia una misura della varianza spiegata.R

Qualche semplice spiegazione di questo?

Grazie mille per l'aiuto con questo!


Stai cercando qualcosa di intuitivo o più matematico? Hai esaminato alcune delle altre domande su e coefficienti di correlazione su questo sito? R2
cardinale

1
Due domande correlate sono qui e qui , per esempio. Se giochi lì con le equazioni, sarai in grado di derivare l'equivalenza matematica. Ma nessuno dei due può essere particolarmente utile dal punto di vista dell'intuizione.
cardinale

Lo vedo al contrario. È R quadrato che è definito come 1 varianza residua / varianza totale e quindi R è la radice quadrata postiva di quello. Accade semplicemente che quando abbiamo una regressione lineare semplice, il quadrato R si riduce al quadrato del coefficiente di correlazione.
Michael R. Chernick,

@Michael, hai senza dubbio voluto dire la radice quadrata opportunamente firmata piuttosto che quella positiva .
cardinale

1
@ cardinale, ho la stessa impressione - (o r ) si riferisce al coefficiente di correlazione del campione e sarei sorpreso di vedere un riferimento ampiamente usato che lo utilizza per fare riferimento al valore assoluto della correlazione del campioneRr
Macro

Risposte:


15

Mano wavingly, la correlazione può essere pensato come una misura dell'angolo tra due vettori, il vettore dipendente Y ed il vettore indipendente X . Se l'angolo tra i vettori è θ , la correlazione R è cos ( θ ) . La parte di Y spiegata da X è di lunghezza | | Y | | cos ( θ ) ed è parallelo a X (o alla proiezione di Y su X ). La parte non spiegata è di lunghezzaRYXθRcos(θ)YX||Y||cos(θ)XYX ed è ortogonale X . In termini di varianze, abbiamo σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ) dove il primo termine a destra è la varianza spiegata e il secondo la varianza inspiegabile. La frazione che si spiega è quindi R 2 , non R .||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R

2
(+1) Non c'è molto da fare a mano qui. Il punto di vista geometrico è il più intuitivo, a mio avviso. È probabile che esista una figura open source di alta qualità che descrive le cose proprio in questo modo.
cardinale

cor(y,y^)2R2

1
Questo non risponde alla domanda, ma mostra come il quadrato R sia menzionato come il quadrato del coefficiente di correlazione senza alcun riferimento a R. Quindi le fonti che confermano o confutano la mia affermazione possono essere difficili da trovare. Questo è tratto da un articolo sul coefficiente di determinazione in Wikipedia:
Michael R. Chernick,

Come coefficiente di correlazione al quadrato Analogamente, dopo la regressione dei minimi quadrati con un modello costante + lineare (ovvero, regressione lineare semplice), R2 è uguale al quadrato del coefficiente di correlazione tra i valori dei dati osservati e modellati (previsti).
Michael R. Chernick,

In condizioni generali, a volte un valore R2 viene calcolato come il quadrato del coefficiente di correlazione tra i valori dei dati originali e modellati. In questo caso, il valore non è direttamente una misura di quanto siano buoni i valori modellati, ma piuttosto una misura di quanto un buon predittore possa essere costruito dai valori modellati (creando un predittore rivisto della forma α + βƒi). Secondo Everitt (2002, p. 78), questo uso è specificamente la definizione del termine "coefficiente di determinazione": il quadrato della correlazione tra due variabili (generali).
Michael R. Chernick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.