parziale dovrebbe sommare a totale nella regressione multipla?


12

Di seguito è riportato un modello creato dal mtcarsset di dati:

> ols(mpg~wt+am+qsec, mtcars)

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

Il modello sembra buono con totale di 0,85. Tuttavia, i valori parziali visti nel diagramma seguente non si sommano a questo valore. Si sommano a circa 0,28.R 2R2R2

> plot(anova(mod), what='partial R2')

inserisci qui la descrizione dell'immagine

V'è alcuna relazione tra somma di tutte parziale e totale ? L'analisi viene eseguita con il pacchetto.R 2R2R2rms


1
(Oltre all'ottima risposta dell'ameba) Una domanda stretta sul coefficiente di regressione standardizzato rispetto alle statistiche di correlazione parzialestackexchange.com/q/76815/3277 .
ttnphns,

Risposte:


11

No.

Un modo per comprendere l' parziale per un dato predittore è che equivale che otterresti se prima regredissi la tua variabile indipendente su tutti gli altri predittori , prendi i residui e regredisci su quello del predittore rimanente.R 2R2R2

Quindi, se ad esempio tutti i predittori sono perfettamente identici (collineari), si può avere decente , ma parziale per tutti i predittori sarà esattamente zero, perché ogni singolo predittore ha zero potere esplicativo aggiuntivo.R 2R2R2

D'altra parte, se tutti i predittori insieme spiegano perfettamente la variabile dipendente, cioè , allora anche parziale per ciascun predittore sarà , perché tutto ciò che non è spiegato da tutti gli altri predittori può essere perfettamente spiegato dai rimanenti uno.R 2 1R2=1R21

Quindi la somma di tutto parziale può essere facilmente inferiore o superiore al totale . Non devono coincidere anche se tutti i predittori sono ortogonali. parziale è un po 'una misura strana.R 2 R 2R2R2R2

Vedi questo lungo thread per molti altri dettagli: Importanza dei predittori nella regressione multipla: parziale rispetto a coefficienti standardizzatiR2 .


Grazie per una spiegazione molto chiara. Questo potrebbe accadere anche nella situazione in questa domanda: stats.stackexchange.com/questions/155447/… . Quindi il R ^ 2 parziale è un ragionevole indicatore di importanza o contributo dei singoli predittori? Oppure suggeriresti qualcos'altro come "proporzione R ^ 2" o "rimanente R ^ 2" o "chisq" o "chisq minus df" o "proporzione chisq" o "aic"? Tutti questi sono disponibili nel pacchetto rms. O coefficienti standardizzati?
anche il

Sì, non sono sicuro del motivo per cui questa domanda sia stata messa in sospeso in quanto poco chiara; Penso che sia chiaro (ed è quasi un duplicato di questo, ma probabilmente non del tutto). Per quanto riguarda gli indicatori ragionevoli di importanza dei predittori: vi invito caldamente a leggere il thread a cui mi sono collegato nella mia risposta, che riguarda proprio questa domanda. C'è anche la mia risposta, dove faccio una breve panoramica di diversi indicatori. Tutti hanno vari difetti; sembra che non ci sia (e non possa essere una) soluzione perfetta a questo problema.
ameba dice Ripristina Monica il

Ho messo in attesa come poco chiaro perché nessuna spiegazione a tutti è stato dato di come i due modelli differivano. Forse ho sbagliato a pensare che fosse cercata una risposta per quella specifica situazione. Data questa risposta, pensate che sia necessario riaprire?
Scortchi - Ripristina Monica

Quindi R2 parziale sono comparabili all'interno di un grafico e non tra 2 grafici. Anche 'R2 parziale' non indica realmente il contributo al totale R2 e quindi penso che sia un termine improprio. Non c'è bisogno di altre domande ora poiché ho la risposta qui.
anche il

Ho votato tutte le risposte. Anche allora ho accettato la stragrande maggioranza delle mie domande.
anche il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.