Qual è la relazione tra


17

Mi chiedevo se ci fosse una relazione tra R2 e un F-Test.

Solitamente

R2=(Y^tY¯)2/T1(YtY¯)2/T1
e misura la forza della relazione lineare nella regressione.

Un test F dimostra solo un'ipotesi.

Esiste una relazione tra R2 e un test F?


2
La formula per sembra errata, non solo perché mancano alcuni caratteri nel denominatore: quei termini " - 1 " non appartengono. La formula corretta sembra molto più simile a una statistica F :-). R21F
whuber

Risposte:


23

Se tutte le ipotesi sono valide e hai la forma corretta per la normale statistica F può essere calcolata come F = R 2R2 . Questo valore può quindi essere confrontato con la distribuzione F appropriata per eseguire un test F. Questo può essere derivato / confermato con l'algebra di base.F=R21R2×df2df1


2
potresti definire df1 e df2?
Bonobo,

1
@bonobo, df1 è il grado di libertà del numeratore (basato sul numero di predittori) e df2 è il grado di libertà del denominatore.
Greg Snow,

1
Per chiarire ulteriormente i gradi di libertà: df1 = k, dove k è il numero di predittori. df1 è chiamato "gradi numeratori di libertà", anche se è nel denominatore in questa formula. df2 = n− (k + 1), dove n è il numero di osservazioni e k è il numero di predittori. df2 è chiamato "gradi denominatori di libertà", anche se è presente nel numeratore in questa formula.
Tim Swast,

5
@GregSnow potresti prendere in considerazione l'aggiunta alla risposta delle definizioni dei gradi di libertà? Ho suggerito una modifica del genere su stats.stackexchange.com/review/suggested-edits/175306 ma è stata respinta.
Tim Swast,

22

Ricordiamo che in un'impostazione di regressione, la statistica F è espressa nel modo seguente.

F=(TSSRSS)/(p1)RSS/(np)

dove TSS = somma totale dei quadrati e RSS = somma residua dei quadrati, è il numero di predittori (compresa la costante) e n è il numero di osservazioni. Questa statistica ha una distribuzione F con gradi di libertà p - 1 e n - p .pnFp1np

Ricorda anche che

R2=1RSSTSS=TSSRSSTSS

una semplice algebra ti dirà che

R2=1(1+Fp1np)1

dove F è la statistica F dall'alto.

Questa è la relazione teorica tra la statistica F (o il test F) e .R2

L'interpretazione pratica è che un più grande porta a valori elevati di F, quindi se R 2 è grande (il che significa che un modello lineare si adatta bene ai dati), la statistica F corrispondente dovrebbe essere grande, il che significa che dovrebbe esserci essere una prova evidente che almeno alcuni dei coefficienti sono diversi da zero.R2R2



-1

Inoltre, rapidamente:

R2 = F / (F + np / p-1)

Ad esempio, R2 di un test F 1df = 2,53 con dimensione del campione 21, sarebbe:

R2 = 2,53 / (2,53 + 19) R2 = .1175


1
Non vedo come questo aggiunga qualcosa oltre ciò che è già nella risposta di Zheng Li.
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.